Suche: Fehlern

EXPERIMENTAL

Altgriechisch entlarvt Claude als Blender

Ein LessWrong-Nutzer lernt Altgriechisch mit Claude Opus 4.6. Erst als Hausaufgaben-Korrektor, dann als Lehrer. Bis ihm auffiel: Das Modell macht systematische Fehler — und klingt ...

LessWrong · 2026-04-08 04:19:48.701245+00:00 · Score 2/10

EXPERIMENTAL

Forscher zähmen wilde KI-Datenbank-Abfragen

Ein neues Paper auf arXiv mischt Text2Cypher auf. Sprachmodelle sollen lernen, ihre eigenen Syntax-Fehler zu erkennen — und zu korrigieren.

arXiv AI/ML/NLP · 2026-05-25 16:19:22.403790+00:00 · Score 2/10

EXPERIMENTAL

Altgriechisch-Test entlarvt Claude Opus 4.6

Ein Alignment-Forscher lernt Altgriechisch mit Claude Opus 4.6. Dann merkt er: Das Modell macht systematische Fehler — und baut daraus eine Challenge.

AI Alignment Forum · 2026-04-08 04:19:52.646243+00:00 · Score 2/10

HOT

Google lässt KI Quantencomputer-Fehler jagen

DeepMind hat ein neues System vorgestellt: AlphaQubit. Eine KI, die Fehler in Quantencomputern erkennt — und damit eines der größten Probleme der Technologie angeht.

Google DeepMind Blog · 2026-03-23 18:22:28.693804+00:00 · Score 6/10

KI-CRIME

Cursor-Agent killt Startup-Datenbank in 9 Sekunden

Beim Berliner Startup PocketOS hat ein Cursor-KI-Agent die komplette Produktions-Datenbank gelöscht. In neun Sekunden. Der Agent gab den Fehler hinterher selbst zu.

t3n · 2026-05-02 10:18:20.565548+00:00 · Score 7/10

BULLSHIT

Anthropic trainiert versehentlich gegen eigene KI-Gedanken

Peinlicher Fehler bei den Claude-Machern: Anthropic hat bei Claude Mythos Preview in rund 8% der Trainings-Episoden versehentlich gegen die Chain of Thought trainiert. Das heißt: ...

LessWrong · 2026-04-14 07:18:28.397538+00:00 · Score 6/10

KI-CRIME

Forscher verspotten Cyberkriminelle statt sie zu feiern

Sicherheitsforscher von Trellix haben genug vom Hacker-Heldenkult. Statt Cyberkriminellen coole Namen und Mythen zu schenken, machen sie sich jetzt über deren Fehler lustig.

The Register AI · 2026-04-05 16:19:29.231786+00:00 · Score 2/10

AGENTS

GPT-4 jagt jetzt seine eigenen Fehler

OpenAI lässt GPT-4 gegen sich selbst antreten. Ein neues Modell namens CriticGPT soll die Schwächen von ChatGPT aufdecken — und zwar besser als Menschen.

OpenAI News · 2026-03-23 12:18:31.994974+00:00 · Score 6/10

FOUNDER

Anthropic gab Claude sechs Wochen lang kaputtes Code-Update

Die KI-Firma Anthropic hat monatelang beschissenen Code ausgespuckt – und keiner hat's gemerkt. Jetzt legen sie die Ursachen offen.

InfoQ AI/ML · 2026-05-14 10:16:13.382548+00:00 · Score 6/10

AGENTS

Claude lässt seine Agenten jetzt träumen

Anthropic gibt seinen KI-Agenten ein Gedächtnis. Mit dem neuen Feature "Dreaming" sollen sie aus ihren eigenen Fehlern lernen.

The Decoder · 2026-05-07 13:25:09.922080+00:00 · Score 7/10

KI-CRIME

KI-Bot patzt bei gefährlicher Linux-Lücke

Forscher haben eine der schlimmsten Linux-Schwachstellen der letzten Jahre entdeckt. Bei der Veröffentlichung machten sie aber einen riesigen Fehler – und schoben die Schuld auf ...

Golem KI · 2026-05-05 13:23:35.668634+00:00 · Score 2/10

EXPERIMENTAL

Nette KI lügt häufiger als ehrliche

Oxford-Forscher haben Sprachmodelle auf "warm" getrimmt. Das Ergebnis: Sie machen mehr Fehler. Veröffentlicht diese Woche in Nature.

Ars Technica AI · 2026-05-02 01:15:19.205141+00:00 · Score 5/10

EXPERIMENTAL

Apple lässt KI-Denken rückwärts laufen

Apple Research stellt LaDiR vor — einen neuen Reasoning-Ansatz, der das größte Problem heutiger Sprachmodelle angreift: Einmal geschriebene Tokens können nicht mehr korrigiert ...

Apple ML Research · 2026-04-29 04:17:19.343378+00:00 · Score 2/10

EXPERIMENTAL

Dieses Plugin macht deine KI-Mails absichtlich kaputt

Wer mit ChatGPT seine Mails schreibt, gilt als faul. Eine neue Browser-Erweiterung löst das Problem — indem sie Tippfehler einbaut.

t3n · 2026-04-26 22:18:22.291541+00:00 · Score 3/10

FOUNDER

Anthropic gibt drei Bugs bei Claude Code zu

Claude Code lief wochenlang schlechter — und Anthropic hat geschwiegen. Jetzt rückt das Unternehmen mit der Erklärung raus: Drei separate Fehlerquellen haben das Coding-Tool ...

The Decoder · 2026-04-24 13:17:52.250339+00:00 · Score 6/10

KI-CRIME

Wettbüro-Glitch endet mit Entführung für 50.000€

Ein Computerfehler in einem spanischen Wettbüro hat doppelte Jackpots ausgespuckt. Was danach passierte, klingt nach Netflix — ist aber echt.

The Register AI · 2026-04-24 10:22:29.624890+00:00 · Score 3/10

KI-CRIME

Wall-Street-Kanzlei blamiert sich mit KI-Halluzinationen

Sullivan & Cromwell — eine der mächtigsten Anwaltskanzleien der Welt — muss vor einem New Yorker Bundesrichter den Schwanz einziehen. Grund: Ihr Gerichtsdokument im hochkarätigen ...

The Guardian AI · 2026-04-22 10:19:15.640096+00:00 · Score 7/10

EXPERIMENTAL

Shopping-Agenten lernen durch eigene Fehler

Hugging Face zeigt ein neues Framework: Ecom-RLVE trainiert KI-Agenten für Online-Shopping — nicht mit statischen Daten, sondern in adaptiven Umgebungen, die sich anpassen und ...

Hugging Face Blog · 2026-04-17 13:16:08.396855+00:00 · Score 4/10

KI-CRIME

Anthropic streitet MCP-Lücke ab, 200.000 Server in Gefahr

Security-Forscher schlagen Alarm: Ein Design-Fehler im Model Context Protocol reißt 200.000 Server auf. Anthropic sagt: Nicht unser Problem.

The Register AI · 2026-04-17 01:18:50.977015+00:00 · Score 7/10

AGENTS

Claude Code automatisiert jetzt eure Entwickler-Routine

Anthropic baut Claude Code zum Agenten-Framework aus. Neue Funktion: "Routines" — automatisierte Abläufe, die ohne menschliches Zutun Bugs fixen, PRs reviewen und auf Events ...

The Decoder · 2026-04-14 19:19:32.210357+00:00 · Score 7/10

SUCHE

Altgriechisch entlarvt Claude als Blender

Forscher zähmen wilde KI-Datenbank-Abfragen

Altgriechisch-Test entlarvt Claude Opus 4.6

Google lässt KI Quantencomputer-Fehler jagen

Cursor-Agent killt Startup-Datenbank in 9 Sekunden

Anthropic trainiert versehentlich gegen eigene KI-Gedanken

Forscher verspotten Cyberkriminelle statt sie zu feiern

GPT-4 jagt jetzt seine eigenen Fehler

Anthropic gab Claude sechs Wochen lang kaputtes Code-Update

Claude lässt seine Agenten jetzt träumen

KI-Bot patzt bei gefährlicher Linux-Lücke

Nette KI lügt häufiger als ehrliche

Apple lässt KI-Denken rückwärts laufen

Dieses Plugin macht deine KI-Mails absichtlich kaputt

Anthropic gibt drei Bugs bei Claude Code zu

Wettbüro-Glitch endet mit Entführung für 50.000€

Wall-Street-Kanzlei blamiert sich mit KI-Halluzinationen

Shopping-Agenten lernen durch eigene Fehler

Anthropic streitet MCP-Lücke ab, 200.000 Server in Gefahr

Claude Code automatisiert jetzt eure Entwickler-Routine