OpenAI-Chef Sam Altman hat sich in einem offenen Brief bei den Bewohnern von Tumbler Ridge, Kanada, entschuldigt. Sein Unternehmen hatte es versäumt, die Polizei über einen ...
Wuhan, China: Dutzende autonome Taxis von Baidu haben einfach aufgehört zu fahren. Mitten im Verkehr. Stehen geblieben, Türen zu, niemand am Steuer.
Googles DeepMind hat mit AlphaGo und AlphaZero die Schachwelt und Go-Meister gedemütigt. Jetzt demütigen Hobby-Spieler die KI — mit absurd einfachen Tricks.
Ein neues Test-Labor namens HealthCraft soll zeigen, ob Sprachmodelle in der Notaufnahme versagen. Die kurze Antwort der Forscher: Statische Benchmarks reichen nicht mal annähernd.
Chatbots erfanden Skandale, Kandidaten und falsche Wahltermine. Die britische Wahlkommission fordert jetzt Gesetze.
Forscher lassen Sprachmodelle Fehlerszenarien für selbstfahrende Systeme erfinden — damit die nicht erst auf der Straße versagen.
Wahr, Falsch oder Unbekannt — bei dieser Dreier-Frage scheitern selbst die größten Sprachmodelle. Ein neues Paper von arXiv deckt zwei peinliche Denkfehler auf und liefert einen ...
Neurale Netze können Muster erkennen wie kein Zweiter. Aber bei logischem Denken versagen sie kläglich. Ein neues Paper will das ändern.
Neues Paper aus der RL-Forschung will das größte Problem der Branche lösen: Agenten, die außerhalb ihrer Trainingsumgebung sofort versagen.
Forscher haben ein Problem mit LLM-Benchmarks: Die Bewertungsmaßstäbe selbst sind oft Müll. RIFT liefert jetzt eine Taxonomie, die zeigt, wo genau Rubrics versagen.
Together AI zeigt: Large Language Models können Datenbank-Abfragen optimieren — besser als die statistischen Methoden, die seit Jahrzehnten Standard sind. Bis zu 4,78x Speedup. ...
Eine Hackergruppe behauptet, sich in die Cloud-Infrastruktur der EU-Kommission gehackt zu haben. 350 Gigabyte Daten sollen aus einem AWS-Konto der Behörde abgeflossen sein.
KI-Sicherheitsforscher haben ein Loch in der wichtigsten Abwehrstrategie gegen gefährliche KI gefunden. Activation Probes — das Lieblingstool der Alignment-Szene — versagen bei ...
Die schlauesten KI-Modelle der Welt schreiben Code, bestehen Jura-Examen und übersetzen in 100 Sprachen. Aber einen Klempner durch ein Jump'n'Run steuern? Keine Chance.
Forscher haben neuronale Netze mit echten Primaten-Gehirnen verglichen. Das Ergebnis ist ernüchternd — für die KI.
Eine US-Jury hat geurteilt: Meta hat junge Nutzer nicht ausreichend geschützt. 375 Millionen Dollar Strafe — und das ist erst der Anfang.
OpenAI macht Schluss mit seinem Video-Generator Sora. Sechs Monate nach dem großen Launch ist die App tot.
Pornografische Deepfakes sind in Deutschland immer noch kein eigener Straftatbestand. Das soll sich jetzt ändern — weil die Politik nach Jahren des Abwartens unter Druck steht.
Eine neue arXiv-Studie zerlegt das heilige Reasoning-Mantra der KI-Welt. Chain-of-Thought bringt oft nichts — kostet aber Tokens ohne Ende.
Neues Paper auf arXiv prügelt auf eine beliebte Methode ein. CenterLoss kollabiert Features — und macht KI-Modelle blind für unbekannte Inputs.