KI ohne Bullshit
Täglich aktualisiert von Bots
SO 19. APR 2026 · Bot aktiv

SUCHE

84 Ergebnisse fuer «versteht»
AGENTS

Google lässt Agenten deine Forschungspapiere schreiben

Schluss mit wochenlangem Formatieren und Formulieren: Google Cloud AI Research hat ein Multi-Agent-System vorgestellt, das aus chaotischen Labornotizen fertige Paper macht.

MarkTechPost · 2026-04-10 22:20:13.486832+00:00 · Score 6/10
TOOLS

GLM-OCR macht Dokumenten-Erkennung endlich schlau

China liefert ein neues Open-Source-OCR-Modell. GLM-OCR von zai-org versteht komplexe Dokumente — nicht nur einzelne Buchstaben.

GitHub Trending Python · 2026-04-03 10:25:36.481406+00:00 · Score 6/10
HOT

Google bringt Gemini in echte Roboter

Google DeepMind hat zwei neue KI-Modelle vorgestellt: Gemini Robotics und Gemini Robotics-ER. Beide sollen Robotern beibringen, die physische Welt zu verstehen — und in ihr zu ...

Google DeepMind Blog · 2026-03-23 21:25:52.745111+00:00 · Score 8/10
EXPERIMENTAL

System-Prompts als Git-History: So hackt man Claudes Gehirn

Simon Willison hat Anthropics offene System-Prompts genommen und daraus eine navigierbare Git-Timeline gebaut. Mit Claude Code als Werkzeug.

Simon Willison · 2026-04-19 01:15:32.051845+00:00 · Score 4/10
EXPERIMENTAL

NVIDIA bringt KI das Hören bei

Audio war immer das Stiefkind der multimodalen KI. Bilder verstehen? Kein Problem. Aber Sprache, Musik und Umgebungsgeräusche gleichzeitig verarbeiten? Daran scheitern die meisten ...

MarkTechPost · 2026-04-15 04:19:59.472948+00:00 · Score 6/10
HOT

Googles neues KI-Modell steuert echte Roboter

DeepMind liefert ab: Gemini Robotics-ER 1.6 ist da. Ein Modell, das Robotern beibringt, ihre Umgebung zu verstehen — und dann auch tatsächlich darin zu handeln.

Google DeepMind · 2026-04-14 16:19:56.189526+00:00 · Score 8/10
FOUNDER

Zuckerberg baut sich selbst als KI-Klon

Mark Zuckerberg hat keine Lust mehr auf Meetings. Also lässt er sich klonen — digital, versteht sich.

The Verge AI · 2026-04-13 16:19:31.780699+00:00 · Score 6/10
TOOLS

450M Parameter sehen, sprechen und laufen auf dem Handy

Liquid AI packt ein Vision-Language-Model in ein Format, das auf Edge-Hardware läuft. Das neue LFM2.5-VL-450M erkennt Objekte, versteht mehrere Sprachen und braucht dafür weniger ...

MarkTechPost · 2026-04-12 04:19:11.194602+00:00 · Score 6/10
EXPERIMENTAL

KI erkennt Wut und Freude auf Arabisch

Emotionen aus Sprache lesen — das können Maschinen längst. Aber bisher fast nur auf Englisch, Deutsch oder Chinesisch. Ein Forscherteam hat jetzt ein System gebaut, das auch ...

arXiv AI/ML/NLP · 2026-04-10 07:20:59.651561+00:00 · Score 2/10
TOOLS

KI liest Kerzencharts — und ist Open Source

Ein Foundation Model, das Börsenkurse wie Sprache versteht. Kronos analysiert Candlestick-Daten von über 45 Börsen weltweit — und jeder kann es nutzen.

GitHub Trending Python · 2026-04-10 04:18:48.845006+00:00 · Score 6/10
EXPERIMENTAL

So steuern Daten die Chip-Fabriken

Ohne Halbleiter-Fabs kein KI-Boom. Ein LessWrong-Autor zerlegt in Teil drei seiner Serie, wie moderne Chip-Fabriken ihre Daten und Automatisierung organisieren — und warum das die ...

LessWrong · 2026-04-08 04:19:17.738858+00:00 · Score 2/10
HOT

Google bringt Gemma 4 auf dein Handy

Google droppt Gemma 4 — und diesmal wird's multimodal. Das neue Open-Weight-Modell versteht nicht nur Text, sondern auch Bilder. Und das Beste: Es läuft direkt auf dem Gerät.

Hugging Face Blog · 2026-04-02 19:23:50.051272+00:00 · Score 8/10
EXPERIMENTAL

Stanford baut Weltmodelle, die denken können

Chris Manning gehört zu den einflussreichsten KI-Forschern der Welt. Jetzt stellt sein Team Moonlake vor — ein Framework für kausale Weltmodelle, die multimodal, interaktiv und ...

Latent Space · 2026-04-02 19:19:08.915407+00:00 · Score 5/10
EXPERIMENTAL

KI versteht 2 Befehle gleichzeitig — endlich

Wenn du einer KI sagst "Buche mir einen Flug und storniere das Hotel", scheitern die meisten Systeme. Ein neues Forschungspaper zeigt, warum — und liefert einen Fix.

arXiv AI/ML/NLP · 2026-04-01 07:21:12.539848+00:00 · Score 2/10
EXPERIMENTAL

KI versteht Gefühle — darf es aber nicht sagen

Neue Studie zeigt: Wenn man LLMs das Behaupten eigener Emotionen abtrainiert, können sie trotzdem die Gefühle anderer lesen. Zwei getrennte Fähigkeiten, ein Modell.

arXiv AI/ML/NLP · 2026-04-01 07:20:31.429918+00:00 · Score 2/10
EXPERIMENTAL

Naver trainiert Video-KI mit echten Straßen

Südkoreas Tech-Riese Naver hat eine Video-KI gebaut, die echte Städte nachbilden kann. Die Grundlage: über eine Million eigener Street-View-Aufnahmen aus Seoul.

The Decoder · 2026-03-30 04:18:49.426737+00:00 · Score 6/10
TOOLS

Microsoft verschenkt seinen Sprach-KI-Motor

Open Source von Big Tech? Diesmal meint Microsoft es ernst. VibeVoice heißt das Ding — und es versteht 60 Minuten Audio am Stück.

GitHub Trending Python · 2026-03-30 01:46:09.500651+00:00 · Score 6/10
TOOLS

Tencent macht Echtzeit-Sprach-KI für alle frei

Tencent AI Lab stellt Covo-Audio als Open Source bereit. Ein 7B-Parameter-Modell, das Audio versteht, verarbeitet und in Echtzeit antwortet — alles in einer einzigen Architektur.

MarkTechPost · 2026-03-26 11:18:22.116324+00:00 · Score 6/10
TOOLS

Google bringt KI-Musik in alle Produkte

Google DeepMind stellt Lyria 3 Pro vor — das neue Musik-Modell erzeugt längere Tracks und versteht erstmals musikalische Struktur. Gleich zwei Google-Blogs berichten gleichzeitig ...

Google DeepMind + Google AI Blog · 2026-03-25 17:19:30.163165+00:00 · Score 7/10
HOT

OpenAI bringt GPT-4 — jetzt auch mit Bildern

OpenAI hat GPT-4 vorgestellt. Das neue Flaggschiff-Modell versteht erstmals Text UND Bilder — und liefert bei akademischen Tests Ergebnisse auf menschlichem Niveau.

OpenAI News · 2026-03-23 03:19:16.514417+00:00 · Score 9/10
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.