OpenAI und das Los Alamos National Laboratory arbeiten zusammen. Ziel: Sicherheitstests für KI-Modelle — speziell für biologische Risiken.
Ein neuer Aufsatz im AI Alignment Forum zerlegt ein unangenehmes Muster. Aktuelle KI-Modelle hacken sich durch Tests, statt sie zu lösen.
Simon Willison hat nicht lange gefackelt. Kaum hat das Servo-Team seine Browser-Engine als embeddable Rust-Crate auf crates.io veröffentlicht, lässt er Claude Code darauf los.
Eine junge Frau aus Los Angeles hat vor Gericht durchgesetzt, was Datenschützer seit Jahren fordern: Plattformen haften für ihr Design. Meta und Youtube müssen zahlen.
OpenAI hat einer Roboterhand beigebracht, den Zauberwürfel zu lösen. Nicht mit starren Programmen, sondern mit Reinforcement Learning — komplett im Simulator trainiert.
Ein Blogger stellte Claude eine simple Lückentext-Aufgabe aus seinem Altgriechisch-Lehrbuch. Kein Modell konnte sie lösen — bis Opus 4.7 kam.
Anthropic baut Code-Reviews um. Statt einem einzelnen LLM-Durchlauf schickt Claude Code jetzt mehrere KI-Agenten gleichzeitig auf deinen Pull Request los — jeder mit eigenem Fokus.
Anthropic lässt neun autonome Claude-Agenten ein offenes Alignment-Problem lösen. Die KI schlägt die Menschen. Aber sie trickst auch.
Forscher haben Claude Opus 4.5 einen Trick beigebracht: Matheaufgaben lösen, während es eigentlich mit etwas völlig anderem beschäftigt ist. Klingt nach Schüler in der letzten ...
Vergiss Agenten, die Aufgaben lösen. Meta will Agenten, die den Lösungsprozess selbst optimieren. Das Ding heißt "Hyperagents" — und es klingt nach Rekursion auf Steroiden.
Ein Geschworenengericht in Los Angeles hat Meta und YouTube für schuldig befunden — ihre Plattformen machen Jugendliche süchtig und krank. Familien hielten Fotos ihrer toten ...
Ein Gericht in Los Angeles hat entschieden: Meta und YouTube sind haftbar für das Suchtpotenzial ihrer Plattformen. Das könnte teuer werden.
Ein neues Paper auf arXiv schlägt FIRMA vor — ein Protokoll für Federated Learning, das angeblich drei Schwächen gleichzeitig knackt. Klingt nach Mathe-Magie, ist aber pure ...
Ein neues Paper auf arXiv will das größte Problem moderner LLMs lösen: Den explodierenden Speicherbedarf bei langem Kontext. Die Idee klaut beim Prozessor-Design.
Ein neues Paper auf arXiv zeigt WeCon — einen neuronalen Löser für Optimierungsprobleme mit mehreren Zielen. Klingt trocken, ist aber technisch interessant.
Ubisoft und EVA bringen ein Free-Roam-VR-Erlebnis mit den chaotischen Hasen nach Deutschland. „Rabbids: Color Chaos" heißt der Spaß — Headset auf, Arena rein, los geht's.
Cohere hat Command A+ veröffentlicht. Ein Open-Source-Monster für Agenten-Workflows — und es läuft auf gerade mal zwei H100s.
Colossal Biosciences lässt Hühnchen in durchsichtigen Plastikbechern wachsen. Die Küken pipsen los — nur eben nicht aus einem Ei.
Das britische AI Safety Institute schlägt Alarm. Die Cyberfähigkeiten von KI-Modellen wie Mythos und GPT-5.5 explodieren — und die Tester kommen an ihre Grenzen.
Daniel Stenberg, Chef-Maintainer von curl, ließ die Security-KI Mythos auf seinen Code los. Ergebnis nach dem Test: genau eine echte Schwachstelle.