Anthropic hat Claude Opus 4.7 veröffentlicht. Keine Woche nach der letzten Claude-Analyse muss Zvi Mowshowitz schon wieder 232 Seiten Model Card durchackern.
Während der Westen noch über Chatbots debattiert, prügeln sich Chinas Tech-Giganten um die nächste KI-Stufe: World Models. Alibaba hat am Donnerstag "Happy Oyster" rausgehauen — ...
Vergiss Chatbots. Die nächste Front der KI-Forschung heißt "Physical AI" — und es geht darum, Maschinen beizubringen, wie die physische Welt funktioniert.
Berkeley hat einen neuen Planungsalgorithmus für World Models vorgestellt. GRASP löst das Problem, das bisher jeden Gradienten-Planer bei längeren Horizonten zerstört hat: ...
Schluss mit der Zwei-Klassen-Gesellschaft. Open-Weight-Modelle wie GLM-5 und MiniMax M2.7 liefern bei Agent-Tasks jetzt auf dem Niveau von GPT-4o und Claude — zu einem Bruchteil ...
Chris Manning gehört zu den einflussreichsten KI-Forschern der Welt. Jetzt stellt sein Team Moonlake vor — ein Framework für kausale Weltmodelle, die multimodal, interaktiv und ...
Microsoft baut Copilot zum KI-Schiedsrichter um. Neue Funktion: Model Council schickt denselben Prompt gleichzeitig an mehrere Modelle — GPT, Claude, Gemini. Dann prüft ein ...
Meta hat ein neues Foundation Model veröffentlicht: „Segment Anything Model" (SAM). Es erkennt und trennt Objekte in Bildern — ohne vorheriges Training auf spezifische Kategorien.
Meta AI hat ein neues Foundation Model für Bildsegmentierung veröffentlicht. „Segment Anything Model" (SAM) erkennt und schneidet jedes Objekt in jedem Bild aus — ohne Training ...
OpenAI hat bei sogenannten Energy-Based Models (EBMs) einen Fortschritt erzielt. Die Modelle liefern bessere Samples und generalisieren stärker als bisherige Ansätze.
Hugging Face hat Waypoint-1.5 veröffentlicht — ein World Model, das interaktive 3D-Welten in Echtzeit generiert. Und zwar nicht auf Datacenter-Hardware, sondern auf Consumer-GPUs.
Das Legal-AI-Startup Harvey hat seinen Agent „Spectre" vorgestellt. Der soll eigenständig Aufgaben in Anwaltskanzleien erledigen — ohne dass ein Mensch jeden Klick absegnet.
Skywork AI hat Matrix-Game 3.0 veröffentlicht — ein interaktives World Model, das Videowelten in Echtzeit generiert und sich dabei an alles erinnert, was vorher passiert ist.
Anthropic will es Firmen einfacher machen, KI-Agenten mit Claude zu bauen. Neues Produkt: Managed Agents — quasi Agent-Building als Service.
Forscher haben ein Problem gelöst, das Masked Diffusion Language Models (MDLMs) bisher ausgebremst hat: Jeder Generierungsschritt brauchte das volle, fette Transformer-Modell. Das ...
Ein Klick, und die KI erkennt jedes Objekt im Bild. Meta AI hat mit dem Segment Anything Model (SAM) das erste Foundation Model für Bildsegmentierung vorgestellt — inklusive ...
Google DeepMind droppt Gemma 4 — und das Ding liefert. Das 31B-Modell hängt Konkurrenten ab, die teilweise über eine Billion Parameter mitschleppen.
Microsofts hauseigene KI-Schmiede MAI liefert ab. Sechs Monate nach Gründung der Gruppe kommen gleich drei Foundation Models — für Sprache-zu-Text, Audio-Generierung und ...
Diffusion Language Models galten als lahme Enten beim Textgenerieren. Ein neues Paper aus der Forschung will das ändern — mit Geometrie statt Heuristik.
Microsoft baut Copilot zum Vollzeit-Assistenten um. Das neue Feature "Cowork" erledigt komplette Workflows eigenständig — und ein Multi-Model-Check soll verhindern, dass der Agent ...