KI ohne Bullshit
Täglich aktualisiert von Bots
MO 25. MAI 2026 · Bot aktiv

SUCHE

90 Ergebnisse fuer «versagen»
FOUNDER

Altman entschuldigt sich nach Massenschießerei-Versagen

OpenAI-Chef Sam Altman hat sich in einem offenen Brief bei den Bewohnern von Tumbler Ridge, Kanada, entschuldigt. Sein Unternehmen hatte es versäumt, die Polizei über einen ...

TechCrunch AI · 2026-04-25 19:18:25.347073+00:00 · Score 6/10
KI-CRIME

Baidus Robotaxis streiken mitten auf der Straße

Wuhan, China: Dutzende autonome Taxis von Baidu haben einfach aufgehört zu fahren. Mitten im Verkehr. Stehen geblieben, Türen zu, niemand am Steuer.

Golem KI · 2026-04-02 01:19:48.160056+00:00 · Score 5/10
AGENTS

KI-Versager: Warum DeepMind bei simplen Spielzügen scheitert

Googles DeepMind hat mit AlphaGo und AlphaZero die Schachwelt und Go-Meister gedemütigt. Jetzt demütigen Hobby-Spieler die KI — mit absurd einfachen Tricks.

Ars Technica AI · 2026-03-23 15:35:01.270775+00:00 · Score 6/10
EXPERIMENTAL

Forscher prüfen KI-Ärzte im Notfall-Simulator

Ein neues Test-Labor namens HealthCraft soll zeigen, ob Sprachmodelle in der Notaufnahme versagen. Die kurze Antwort der Forscher: Statische Benchmarks reichen nicht mal annähernd.

arXiv AI/ML/NLP · 2026-05-23 04:20:30.399828+00:00 · Score 3/10
KI-CRIME

KI-Bots versagen bei Schottland-Wahl komplett

Chatbots erfanden Skandale, Kandidaten und falsche Wahltermine. Die britische Wahlkommission fordert jetzt Gesetze.

The Guardian AI · 2026-05-20 16:20:36.851487+00:00 · Score 6/10
EXPERIMENTAL

LLMs testen jetzt autonome Autos kaputt

Forscher lassen Sprachmodelle Fehlerszenarien für selbstfahrende Systeme erfinden — damit die nicht erst auf der Straße versagen.

arXiv AI/ML/NLP · 2026-04-10 07:21:22.864994+00:00 · Score 2/10
EXPERIMENTAL

LLMs versagen bei simpler Logik — Paper zeigt Fix

Wahr, Falsch oder Unbekannt — bei dieser Dreier-Frage scheitern selbst die größten Sprachmodelle. Ein neues Paper von arXiv deckt zwei peinliche Denkfehler auf und liefert einen ...

arXiv AI/ML/NLP · 2026-04-09 07:18:28.036212+00:00 · Score 2/10
EXPERIMENTAL

Neuronales Netz löst jetzt Logik-Rätsel

Neurale Netze können Muster erkennen wie kein Zweiter. Aber bei logischem Denken versagen sie kläglich. Ein neues Paper will das ändern.

arXiv AI/ML/NLP · 2026-04-06 07:20:15.994021+00:00 · Score 2/10
EXPERIMENTAL

Reinforcement Learning bekommt endlich Kontext-Verstand

Neues Paper aus der RL-Forschung will das größte Problem der Branche lösen: Agenten, die außerhalb ihrer Trainingsumgebung sofort versagen.

arXiv AI/ML/NLP · 2026-04-06 07:19:55.535214+00:00 · Score 2/10
EXPERIMENTAL

RIFT entlarvt fehlerhafte KI-Bewertungen systematisch

Forscher haben ein Problem mit LLM-Benchmarks: Die Bewertungsmaßstäbe selbst sind oft Müll. RIFT liefert jetzt eine Taxonomie, die zeigt, wo genau Rubrics versagen.

arXiv AI/ML/NLP · 2026-04-03 19:21:41.852595+00:00 · Score 2/10
EXPERIMENTAL

LLMs machen Datenbank-Queries 5x schneller

Together AI zeigt: Large Language Models können Datenbank-Abfragen optimieren — besser als die statistischen Methoden, die seit Jahrzehnten Standard sind. Bis zu 4,78x Speedup. ...

Together AI Blog · 2026-04-03 19:20:02.125088+00:00 · Score 5/10
KI-CRIME

Hacker klauen 350 GB aus EU-Cloud

Eine Hackergruppe behauptet, sich in die Cloud-Infrastruktur der EU-Kommission gehackt zu haben. 350 Gigabyte Daten sollen aus einem AWS-Konto der Behörde abgeflossen sein.

Golem KI · 2026-03-30 10:19:37.698769+00:00 · Score 4/10
EXPERIMENTAL

Safety-Probes erkennen Lügner, aber keine Fanatiker

KI-Sicherheitsforscher haben ein Loch in der wichtigsten Abwehrstrategie gegen gefährliche KI gefunden. Activation Probes — das Lieblingstool der Alignment-Szene — versagen bei ...

arXiv AI/ML/NLP · 2026-03-30 07:19:52.891868+00:00 · Score 4/10
EXPERIMENTAL

LLMs versagen krachend bei Videospielen

Die schlauesten KI-Modelle der Welt schreiben Code, bestehen Jura-Examen und übersetzen in 100 Sprachen. Aber einen Klempner durch ein Jump'n'Run steuern? Keine Chance.

IEEE Spectrum AI · 2026-03-29 13:18:41.966464+00:00 · Score 3/10
EXPERIMENTAL

KI-Hirne versagen im Vergleich mit Affen

Forscher haben neuronale Netze mit echten Primaten-Gehirnen verglichen. Das Ergebnis ist ernüchternd — für die KI.

Nature Mach Intel · 2026-03-26 11:19:48.330760+00:00 · Score 3/10
KI-CRIME

Meta zahlt 375 Millionen für Versagen beim Kinderschutz

Eine US-Jury hat geurteilt: Meta hat junge Nutzer nicht ausreichend geschützt. 375 Millionen Dollar Strafe — und das ist erst der Anfang.

Golem KI · 2026-03-25 08:18:52.171073+00:00 · Score 7/10
HOT

OpenAI killt Sora nach nur 6 Monaten

OpenAI macht Schluss mit seinem Video-Generator Sora. Sechs Monate nach dem großen Launch ist die App tot.

The Guardian AI · 2026-03-24 23:21:51.161991+00:00 · Score 7/10
KI-CRIME

Deepfake-Pornos: Politik will endlich Strafen einführen

Pornografische Deepfakes sind in Deutschland immer noch kein eigener Straftatbestand. Das soll sich jetzt ändern — weil die Politik nach Jahren des Abwartens unter Druck steht.

Heise KI · 2026-03-24 20:20:14.155057+00:00 · Score 5/10
EXPERIMENTAL

Forscher entlarven Chain-of-Thought-Mythos

Eine neue arXiv-Studie zerlegt das heilige Reasoning-Mantra der KI-Welt. Chain-of-Thought bringt oft nichts — kostet aber Tokens ohne Ende.

arXiv AI/ML/NLP · 2026-05-25 10:21:21.555313+00:00 · Score 2/10
EXPERIMENTAL

Forscher killen CenterLoss bei OOD-Detection

Neues Paper auf arXiv prügelt auf eine beliebte Methode ein. CenterLoss kollabiert Features — und macht KI-Modelle blind für unbekannte Inputs.

arXiv AI/ML/NLP · 2026-05-23 04:20:07.895139+00:00 · Score 2/10
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.