Suche: versteht

EXPERIMENTAL

KI-Maus versteht jetzt, worauf du zeigst

Die Maus ist seit 50 Jahren dumm. Sie weiß nur wo der Cursor ist. Google DeepMind will das ändern — mit KI.

MarkTechPost · 2026-05-13 10:23:24.261343+00:00 · Score 5/10

EXPERIMENTAL

Google baut KI-Mauszeiger — er versteht "das hier"

Google will deine Maus mit KI-Gehirn ausstatten. DeepMind-Forscher haben einen Prototypen vorgestellt, der den Cursor nach 50 Jahren Stillstand endlich klüger macht.

The Register AI · 2026-05-14 01:18:51.090940+00:00 · Score 5/10

EXPERIMENTAL

LLMs verstehen Aufgaben — egal wie du fragst

Prompt-Sensitivity ist das nervigste Problem großer Sprachmodelle. Gleiche Frage, andere Formulierung, anderes Ergebnis. Forscher haben jetzt herausgefunden, warum — und es ist ...

arXiv AI/ML/NLP · 2026-04-27 07:18:09.394706+00:00 · Score 2/10

EXPERIMENTAL

MatterChat: KI liest Materialien wie Röntgenaugen

Ein neues KI-System versteht Kristallstrukturen so gut wie erfahrene Materialwissenschaftler — und erklärt auch noch, warum.

Nature Mach Intel · 2026-04-24 22:23:38.240556+00:00 · Score 4/10

EXPERIMENTAL

Gemma 4 VLA steuert Roboter auf Mini-Hardware

Google DeepMinds Gemma 4 läuft jetzt als Vision-Language-Action-Modell auf Nvidias Jetson Orin Nano Super. Ein KI-Modell, das sieht, versteht und handelt — auf einem Board so groß ...

Hugging Face Blog · 2026-04-22 16:18:26.737335+00:00 · Score 6/10

AGENTS

Google lässt Agenten deine Forschungspapiere schreiben

Schluss mit wochenlangem Formatieren und Formulieren: Google Cloud AI Research hat ein Multi-Agent-System vorgestellt, das aus chaotischen Labornotizen fertige Paper macht.

MarkTechPost · 2026-04-10 22:20:13.486832+00:00 · Score 6/10

TOOLS

GLM-OCR macht Dokumenten-Erkennung endlich schlau

China liefert ein neues Open-Source-OCR-Modell. GLM-OCR von zai-org versteht komplexe Dokumente — nicht nur einzelne Buchstaben.

GitHub Trending Python · 2026-04-03 10:25:36.481406+00:00 · Score 6/10

HOT

Google bringt Gemini in echte Roboter

Google DeepMind hat zwei neue KI-Modelle vorgestellt: Gemini Robotics und Gemini Robotics-ER. Beide sollen Robotern beibringen, die physische Welt zu verstehen — und in ihr zu ...

Google DeepMind Blog · 2026-03-23 21:25:52.745111+00:00 · Score 8/10

AGENTS

Gemini Spark schnüffelt Mails – verpennt Freund

Google lässt seinen neuen Agenten "Spark" auf Mails, Docs und Kalender los. Er soll eine Geburtstagsparty planen – und übersieht ausgerechnet den Freund der Userin.

Wired AI · 2026-05-29 22:18:59.311058+00:00 · Score 6/10

EXPERIMENTAL

KI leitet Café – Chaos garantiert

Ein Startup lässt einen KI-Agent ein Café managen. Das Ergebnis: Bestell-Chaos und kaputte Maschinen.

t3n · 2026-05-12 16:17:31.887174+00:00 · Score 6/10

HOT

Muratis KI spricht, ohne auf Antwort zu warten

Mira Muratis neues Start-up hat sein erstes Modell veröffentlicht. Es soll Sprach-KI endlich natürlich machen.

The Decoder · 2026-05-12 13:16:13.904357+00:00 · Score 8/10

EXPERIMENTAL

Forscher knacken die KI-Blackbox der Proteine

Protein-Sprachmodelle sagen voraus, wie sich Eiweiße falten. Aber keiner versteht, wie sie das machen. Hunklinger und Ferruz wollen das jetzt ändern.

Nature Mach Intel · 2026-05-12 01:21:18.133805+00:00 · Score 2/10

EXPERIMENTAL

Apple will wissen, ob KI denkt

Apple-Forscher haben einen neuen Test für KI-Agenten entwickelt. Es geht nicht mehr nur um Sehen, sondern um Verstehen.

Apple ML Research · 2026-05-07 04:23:55.314443+00:00 · Score 5/10

EXPERIMENTAL

KI baut jetzt das 6G-Netz

Forscher basteln ein neues Fundament für den nächsten Mobilfunk. Ihr Werkzeug: Ein KI-Modell, das den Funkverkehr ganz anders versteht.

arXiv AI/ML/NLP · 2026-05-04 04:22:20.311839+00:00 · Score 2/10

EXPERIMENTAL

Forscher bauen KI-Modell für Naturstoffe

Ein Team um Ding hat ein Foundation Model gebaut, das kleine Moleküle aus Naturstoffen versteht. Ziel: schneller neue Medikamente finden.

Nature Mach Intel · 2026-04-30 07:16:34.445101+00:00 · Score 2/10

TOOLS

NVIDIAs Nano Omni versteht Video, Audio und Text

Ein Modell für alles: NVIDIA hat Nemotron 3 Nano Omni veröffentlicht — und Together AI stellt es Entwicklern ab Tag 1 bereit.

Together AI Blog · 2026-04-28 19:21:11.062614+00:00 · Score 7/10

EXPERIMENTAL

KI versteht Ethik besser als du selbst

Ein Post im AI Alignment Forum behauptet: Sprachmodelle wie Gemini 3 wissen besser, was moralisch zählt, als die meisten Menschen. Klingt größenwahnsinnig. Ist es aber vielleicht ...

AI Alignment Forum · 2026-04-27 22:23:24.173366+00:00 · Score 2/10

HOT

Google zwingt Bildgeneratoren zum Sehen

Ein Modell, das Bilder erzeugt UND versteht — Google DeepMind hat mit Vision Banana die Mauer zwischen generativen und diskriminativen Vision-Modellen eingerissen.

MarkTechPost · 2026-04-25 10:17:58.016841+00:00 · Score 8/10

HOT

OpenAI feuert GPT-5.5 ab — Agentic-Modell schlägt alle

OpenAI hat den Nachfolger rausgehauen. GPT-5.5 ist da und soll endlich denken wie ein Mensch. Nicht nur antworten — handeln.

MarkTechPost · 2026-04-24 01:20:05.673432+00:00 · Score 8/10

EXPERIMENTAL

System-Prompts als Git-History: So hackt man Claudes Gehirn

Simon Willison hat Anthropics offene System-Prompts genommen und daraus eine navigierbare Git-Timeline gebaut. Mit Claude Code als Werkzeug.

Simon Willison · 2026-04-19 01:15:32.051845+00:00 · Score 4/10

SUCHE

KI-Maus versteht jetzt, worauf du zeigst

Google baut KI-Mauszeiger — er versteht "das hier"

LLMs verstehen Aufgaben — egal wie du fragst

MatterChat: KI liest Materialien wie Röntgenaugen

Gemma 4 VLA steuert Roboter auf Mini-Hardware

Google lässt Agenten deine Forschungspapiere schreiben

GLM-OCR macht Dokumenten-Erkennung endlich schlau

Google bringt Gemini in echte Roboter

Gemini Spark schnüffelt Mails – verpennt Freund

KI leitet Café – Chaos garantiert

Muratis KI spricht, ohne auf Antwort zu warten

Forscher knacken die KI-Blackbox der Proteine

Apple will wissen, ob KI denkt

KI baut jetzt das 6G-Netz

Forscher bauen KI-Modell für Naturstoffe

NVIDIAs Nano Omni versteht Video, Audio und Text

KI versteht Ethik besser als du selbst

Google zwingt Bildgeneratoren zum Sehen

OpenAI feuert GPT-5.5 ab — Agentic-Modell schlägt alle

System-Prompts als Git-History: So hackt man Claudes Gehirn