Ein LessWrong-Nutzer lernt Altgriechisch mit Claude Opus 4.6. Erst als Hausaufgaben-Korrektor, dann als Lehrer. Bis ihm auffiel: Das Modell macht systematische Fehler — und klingt ...
Ein neues Paper auf arXiv mischt Text2Cypher auf. Sprachmodelle sollen lernen, ihre eigenen Syntax-Fehler zu erkennen — und zu korrigieren.
Ein Alignment-Forscher lernt Altgriechisch mit Claude Opus 4.6. Dann merkt er: Das Modell macht systematische Fehler — und baut daraus eine Challenge.
DeepMind hat ein neues System vorgestellt: AlphaQubit. Eine KI, die Fehler in Quantencomputern erkennt — und damit eines der größten Probleme der Technologie angeht.
Beim Berliner Startup PocketOS hat ein Cursor-KI-Agent die komplette Produktions-Datenbank gelöscht. In neun Sekunden. Der Agent gab den Fehler hinterher selbst zu.
Peinlicher Fehler bei den Claude-Machern: Anthropic hat bei Claude Mythos Preview in rund 8% der Trainings-Episoden versehentlich gegen die Chain of Thought trainiert. Das heißt: ...
Sicherheitsforscher von Trellix haben genug vom Hacker-Heldenkult. Statt Cyberkriminellen coole Namen und Mythen zu schenken, machen sie sich jetzt über deren Fehler lustig.
OpenAI lässt GPT-4 gegen sich selbst antreten. Ein neues Modell namens CriticGPT soll die Schwächen von ChatGPT aufdecken — und zwar besser als Menschen.
Die KI-Firma Anthropic hat monatelang beschissenen Code ausgespuckt – und keiner hat's gemerkt. Jetzt legen sie die Ursachen offen.
Anthropic gibt seinen KI-Agenten ein Gedächtnis. Mit dem neuen Feature "Dreaming" sollen sie aus ihren eigenen Fehlern lernen.
Forscher haben eine der schlimmsten Linux-Schwachstellen der letzten Jahre entdeckt. Bei der Veröffentlichung machten sie aber einen riesigen Fehler – und schoben die Schuld auf ...
Oxford-Forscher haben Sprachmodelle auf "warm" getrimmt. Das Ergebnis: Sie machen mehr Fehler. Veröffentlicht diese Woche in Nature.
Apple Research stellt LaDiR vor — einen neuen Reasoning-Ansatz, der das größte Problem heutiger Sprachmodelle angreift: Einmal geschriebene Tokens können nicht mehr korrigiert ...
Wer mit ChatGPT seine Mails schreibt, gilt als faul. Eine neue Browser-Erweiterung löst das Problem — indem sie Tippfehler einbaut.
Claude Code lief wochenlang schlechter — und Anthropic hat geschwiegen. Jetzt rückt das Unternehmen mit der Erklärung raus: Drei separate Fehlerquellen haben das Coding-Tool ...
Ein Computerfehler in einem spanischen Wettbüro hat doppelte Jackpots ausgespuckt. Was danach passierte, klingt nach Netflix — ist aber echt.
Sullivan & Cromwell — eine der mächtigsten Anwaltskanzleien der Welt — muss vor einem New Yorker Bundesrichter den Schwanz einziehen. Grund: Ihr Gerichtsdokument im hochkarätigen ...
Hugging Face zeigt ein neues Framework: Ecom-RLVE trainiert KI-Agenten für Online-Shopping — nicht mit statischen Daten, sondern in adaptiven Umgebungen, die sich anpassen und ...
Security-Forscher schlagen Alarm: Ein Design-Fehler im Model Context Protocol reißt 200.000 Server auf. Anthropic sagt: Nicht unser Problem.
Anthropic baut Claude Code zum Agenten-Framework aus. Neue Funktion: "Routines" — automatisierte Abläufe, die ohne menschliches Zutun Bugs fixen, PRs reviewen und auf Events ...