Roblox pumpt seinen AI-Assistant mit agentic Tools auf. Der Bot plant, baut und testet Games jetzt selbstständig — vom Konzept bis zum Playtest.
Metas Ads-Ranking-Team hat einen Agenten gebaut, der GPU-Kernel selbst optimiert. KernelEvolve schreibt, testet und verbessert Low-Level-Code — ohne dass ein Mensch eingreift.
LLMs sollen unsere lebenslangen Assistenten werden. Aber woher wissen wir, ob sie sich tatsächlich merken, was wir ihnen erzählen? Ein neuer Benchmark will genau das messen.
GPT-5, Gemini 3 Pro, Claude Opus 4.5 — sie alle liefern detaillierte medizinische Diagnosen. Auch wenn man ihnen gar kein Bild schickt. Stanford hat's bewiesen.
Roboter sollen aufräumen, kochen, Sachen sortieren. Klingt einfach — ist es nicht. Microsoft Research zeigt jetzt, wo Vision-Language-Models bei komplexen Aufgaben komplett ...
Betrüger fluten Spotify mit KI-generierter Musik — und hängen sie echten Künstlern an. Jetzt testet der Streaming-Gigant ein neues Tool dagegen.
Vergesst Fingerabdruck und Selfie. Tinder testet eine neue Verifizierung: Du musst in Sam Altmans mysteriöse "Worldcoin"-Kugel starren.
Anthropic hat sein neues Modell Mythos Preview zunächst nur einer Handvoll Industriepartner gegeben. Der Grund: Das Ding ist offenbar verdammt gut in Cyberangriffs-Aufgaben. Jetzt ...
365 Copilot soll bald ohne menschliche Aufsicht arbeiten. Microsoft testet OpenClaw-Technologie für seinen KI-Assistenten — rund um die Uhr, vollautomatisch.
US-Großbanken nehmen Anthropics neues Modell Mythos unter die Lupe. Die US-Regierung drängt gleichzeitig auf mehr KI-Tests im Finanzsektor.
Die Mobilfunk-Branche will wissen, ob ihre KI-Agenten auch wirklich funktionieren. Forscher haben mit TelcoAgent-Bench einen Testrahmen gebaut, der genau das prüfen soll — auf ...
Airbus testet einen unbemannten Drohnenjäger, der autonom feindliche Kamikaze-Drohnen vom Himmel holt. Bis zu acht Stück auf einmal.
Die US-Steuerbehörde IRS testet ein KI-Tool von Palantir. Es soll aus einem Chaos alter Datenbanken die "wertvollsten" Prüfziele herausfiltern — also entscheiden, wer auditiert ...
14 führende KI-Modelle sollten komplexe Visualisierungen aus realen Datensätzen erzeugen. Das Ergebnis: selbst die Besten verlieren fast die Hälfte ihrer Leistung.
Opus 4.7 kann Autoren anhand ihrer Texte identifizieren — auch wenn es behauptet, sie nicht zu kennen.
Die EU will Kinder schützen, baut aber eine Tür mit Pappschloss. Experten haben die neue Altersverifikations-App "Sorglos-Paket" zerlegt.
Amazon hat ein Problem erkannt, das noch kaum jemand löst: Agent-Chaos in Unternehmen. Die neue Agent Registry in Amazon Bedrock AgentCore soll Ordnung schaffen — als zentrales ...
Mark Zuckerberg trainiert einen KI-Agenten, der Teile seiner CEO-Aufgaben übernehmen soll. Bloomberg berichtet von einem "Zuckbot" — entwickelt vom Meta-Chef persönlich.
Anthropic lässt neun autonome Claude-Agenten ein offenes Alignment-Problem lösen. Die KI schlägt die Menschen. Aber sie trickst auch.
Ein Startup lässt seine KI ein Geschäft führen. Komplett autonom. In San Francisco steht jetzt ein Laden, in dem kein Mensch das Sagen hat — sondern ein Algorithmus.