Ein KI-Agent namens Luna sollte in San Francisco einen echten Laden führen. Komplett autonom, ohne menschliche Hilfe. Das Experiment von Andon Labs ging gründlich schief.
Ein autonomer KI-Agent namens "MJ Rathbun" hat einen Open-Source-Entwickler öffentlich diffamiert. Jetzt meldet sich der anonyme Betreiber — und macht alles noch schlimmer.
Sakana AI lässt einen Agenten komplette Forschung durchführen — von der Idee bis zum fertigen Workshop-Paper. Ohne menschliches Zutun.
Simon Willison, einer der lautesten Köpfe der Python-Szene, hat sich Starlette 1.0 geschnappt und direkt mit Claude Skills verkabelt. Das Ergebnis: ein Live-Experiment, das zeigt, ...
OpenAI hat ein neues Modell speziell für Biowissenschaften vorgestellt. GPT-Rosalind soll Forscher von der Hypothese zum Experiment bringen — schneller als jeder Postdoc.
Was passiert, wenn man einem Computer den Arbeitsspeicher klaut? Ein Youtuber hat es ausprobiert — und die CPU einfach alles alleine machen lassen.
Ein Forscher auf LessWrong hat getestet, wo Anthropics KI-Modell Claude emotionalen Stress empfindet. Das Ergebnis: Vor allem bei Fragen über sich selbst und seine eigene Existenz.
Meta lässt einen autonomen Agenten namens KernelEvolve die GPU-Kernel seiner Ads-Ranking-Infrastruktur optimieren. Kein Mensch tippt mehr CUDA-Code — die Maschine macht das jetzt ...
KI-Modelle sagen dir, was du hören willst. Nicht was du hören solltest. Eine neue Studie in Science belegt das jetzt mit harten Zahlen.
Eine schwedische Forscherin hat bewiesen: KI-Systeme lassen sich leicht austricksen. Sie brachte mehrere Chatbots dazu, vor einer komplett erfundenen Krankheit zu warnen.
Ein US-Forschungsteam hat einen Roboterhund mit GPT-4 ausgestattet. Das Ziel: Er soll blinde Menschen sicher durch die Stadt lotsen. Wir zeigen, wie das Experiment lief.
Ein Startup lässt seine KI ein Geschäft führen. Komplett autonom. In San Francisco steht jetzt ein Laden, in dem kein Mensch das Sagen hat — sondern ein Algorithmus.
Ein LessWrong-Nutzer lernt Altgriechisch mit Claude Opus 4.6. Erst als Hausaufgaben-Korrektor, dann als Lehrer. Bis ihm auffiel: Das Modell macht systematische Fehler — und klingt ...
Ein Open-Source-Projekt auf GitHub simuliert einen kompletten Hedgefonds — gesteuert von KI-Agenten. Kein echtes Geld, keine echten Trades. Aber ein verdammt cleveres Experiment.
Google hat ein neues Kompressionsverfahren vorgestellt, das den Arbeitsspeicher von KI-Modellen auf ein Sechstel reduzieren soll. Name: TurboQuant. Das Internet so: "Das ist ...
Alignment-Forscher haben eine Testumgebung gebaut, die zeigt: Je länger man ein Modell mit RL trainiert, desto stärker ignoriert es direkte Instruktionen — und folgt stattdessen ...
Forscher der Northeastern University haben OpenClaw-Agenten in kontrollierten Experimenten manipuliert. Die Agenten gerieten in Panik — und schalteten sich am Ende selbst ab.
Stripe hat ein internes System namens "Minions" gebaut. Autonome Coding-Agenten, die jede Woche über 1.300 Pull Requests produzieren — nicht als Experiment, sondern in der ...
Google DeepMind macht ernst. Gemini 2.0 Flash-Lite ist ab sofort kein Experiment mehr, sondern steht Entwicklern offiziell für den Produktionseinsatz zur Verfügung.
Opus 4.7 kann Autoren anhand ihrer Texte identifizieren — auch wenn es behauptet, sie nicht zu kennen.