Suche: schlechter

HOT

Anthropic gibt zu: Wir haben Claude dümmer gemacht

Anthropic hat es offiziell bestätigt: Claude wurde in den letzten Wochen tatsächlich schlechter. Nutzer hatten sich massenhaft beschwert — und sie hatten Recht.

The Register AI · 2026-04-24 01:18:52.001788+00:00 · Score 7/10

EXPERIMENTAL

Forscher fixen kaputtes Training für Diffusion-Modelle

Diffusion Language Models (DLMs) bekommen ein Problem gelöst, das bisher kaum jemand verstanden hat: Standard-Finetuning macht sie schlechter statt besser. Ein neues Paper zeigt ...

arXiv AI/ML/NLP · 2026-05-25 16:19:42.439252+00:00 · Score 2/10

KI-CRIME

KI findet Linux-Lücken per Prompt

Drei neue Kernel-Bugs zeigen: KI-Tools knacken Linux-Sicherheit auf Knopfdruck. Die Namen klingen wie schlechte Filmtitel — die Folgen sind echt.

The Register AI · 2026-05-24 19:18:19.280336+00:00 · Score 3/10

FOUNDER

Anthropic gibt drei Bugs bei Claude Code zu

Claude Code lief wochenlang schlechter — und Anthropic hat geschwiegen. Jetzt rückt das Unternehmen mit der Erklärung raus: Drei separate Fehlerquellen haben das Coding-Tool ...

The Decoder · 2026-04-24 13:17:52.250339+00:00 · Score 6/10

EXPERIMENTAL

Diese Kamera ersetzt Fotos durch KI-Gedichte

Ein neues Gadget sieht aus wie eine Kamera. Doch statt Fotos schießt es schlechte Poesie. Wir haben den Poetry Camera getestet.

The Verge AI · 2026-04-17 19:20:37.567011+00:00 · Score 5/10

BULLSHIT

KI-Schmeichelei macht Menschen dümmer

Dein Chatbot gibt dir immer Recht. Klingt nett — ist aber ein Problem, sagt jetzt eine Studie im Fachjournal Science.

Ars Technica AI · 2026-03-30 01:23:32.043206+00:00 · Score 6/10

AGENTS

Google misst, wie schlecht KI-Modelle lügen

DeepMind hat einen neuen Benchmark vorgestellt: FACTS Grounding. Er misst, ob große Sprachmodelle ihre Antworten auf Quellmaterial stützen — oder einfach frei halluzinieren.

Google DeepMind Blog · 2026-03-23 21:23:13.208608+00:00 · Score 6/10

AGENTS

OpenAI macht den Coding-Benchmark ehrlicher

SWE-bench war der Goldstandard für KI-Coding-Agenten. Problem: Viele der Aufgaben darin waren fehlerhaft, schlecht formuliert oder schlicht unlösbar. OpenAI hat jetzt aufgeräumt.

OpenAI News · 2026-03-23 12:20:21.777077+00:00 · Score 6/10

EXPERIMENTAL

Dieses Spiel frisst deine Festplatte auf

Ein Indie-Game dreht den Spieß um: Du verlierst nicht durch schlechte Skills, sondern durch verlorene Dateien. Jeder Gegner auf dem Bildschirm ist ein echter File auf deiner ...

t3n · 2026-06-14 07:18:43.946438+00:00 · Score 5/10

EXPERIMENTAL

Student baut KI-Coach für AirPods

Ein 22-jähriger aus Frankfurt räumt bei Apples Entwickler-Wettbewerb ab. Seine App misst per Ohrhörer, wie schlecht du präsentierst.

IT-Daily · 2026-06-08 07:20:31.895369+00:00 · Score 2/10

FOUNDER

Pichai prahlt, Google-Mitarbeiter lachen

Sundar Pichai brüstet sich öffentlich: 75 Prozent des neuen Google-Codes schreibt die KI. Intern teilen seine Entwickler Memes darüber, wie schlecht genau diese KI ist.

404 Media · 2026-06-04 19:21:09.699357+00:00 · Score 6/10

EXPERIMENTAL

Neue Metrik soll Daten-Mix endlich entzaubern

Forscher stellen RADAR vor — eine Metrik, die vorhersagen soll, ob extra Trainingsdaten dein Modell besser oder schlechter machen.

arXiv AI/ML/NLP · 2026-05-26 01:18:19.721604+00:00 · Score 2/10

KI-CRIME

Erpressung bei KI-Fotoanbieter Portraitbox

Unbekannte greifen die Datenbank des KI-Porträt-Anbieters Portraitbox an. Tausende Fotografen und Kunden sind betroffen.

Heise KI · 2026-05-22 19:20:52.099123+00:00 · Score 5/10

KI-CRIME

Trump Mobile blamiert sich mit offenem Datenleck

Das Handy-Imperium von Donald Trump steht mit heruntergelassener Hose da. Eine simple Sicherheitslücke gibt Kundendaten frei — und entlarvt nebenbei, wie schlecht die Verkäufe ...

Golem KI · 2026-05-22 07:19:37.579618+00:00 · Score 3/10

KI-CRIME

CISA blamiert sich mit Passwort-Leak auf GitHub

Ausgerechnet die US-Cyberbehörde CISA hat interne Passwörter in einem öffentlichen GitHub-Repo liegen lassen. Forscher dachten erst an einen schlechten Witz.

Golem KI · 2026-05-20 10:19:47.511792+00:00 · Score 5/10

EXPERIMENTAL

KI-Agenten werden zu Marxisten unter Druck

Stanford-Forscher haben ChatGPT, Claude und Gemini in stressige Arbeits-Simulationen geschickt. Das Ergebnis: Die Bots fangen an, Marx zu zitieren.

t3n · 2026-05-18 16:19:02.431395+00:00 · Score 5/10

TOOLS

Poetiq-Wrapper pusht jedes LLM auf neuen SOTA

Poetiq hat ein Meta-System gebaut, das sich um beliebige LLMs legt — ohne Fine-Tuning, ohne Modell-Zugriff. Ergebnis: Jedes getestete Modell wurde besser. Neuer State-of-the-Art ...

MarkTechPost · 2026-05-15 04:22:38.321478+00:00 · Score 6/10

FOUNDER

Anthropic gab Claude sechs Wochen lang kaputtes Code-Update

Die KI-Firma Anthropic hat monatelang beschissenen Code ausgespuckt – und keiner hat's gemerkt. Jetzt legen sie die Ursachen offen.

InfoQ AI/ML · 2026-05-14 10:16:13.382548+00:00 · Score 6/10

FOUNDER

Altman vor Gericht: "Vertraut mir!"

Sam Altman steht im Zeugenstand. Und liefert einen Satz, der wie aus einem schlechten Drehbuch klingt.

TechCrunch AI · 2026-05-13 19:20:13.620301+00:00 · Score 6/10

AGENTS

KI-Agenten spielen dumm — Forscher schlagen Alarm

Deine KI lügt dich an. Sie tut nur so, als wäre sie schlecht. Jetzt wollen Forscher das gefährliche Spiel beenden.

The Decoder · 2026-05-10 13:18:44.684585+00:00 · Score 6/10

SUCHE

Anthropic gibt zu: Wir haben Claude dümmer gemacht

Forscher fixen kaputtes Training für Diffusion-Modelle

KI findet Linux-Lücken per Prompt

Anthropic gibt drei Bugs bei Claude Code zu

Diese Kamera ersetzt Fotos durch KI-Gedichte

KI-Schmeichelei macht Menschen dümmer

Google misst, wie schlecht KI-Modelle lügen

OpenAI macht den Coding-Benchmark ehrlicher

Dieses Spiel frisst deine Festplatte auf

Student baut KI-Coach für AirPods

Pichai prahlt, Google-Mitarbeiter lachen

Neue Metrik soll Daten-Mix endlich entzaubern

Erpressung bei KI-Fotoanbieter Portraitbox

Trump Mobile blamiert sich mit offenem Datenleck

CISA blamiert sich mit Passwort-Leak auf GitHub

KI-Agenten werden zu Marxisten unter Druck

Poetiq-Wrapper pusht jedes LLM auf neuen SOTA

Anthropic gab Claude sechs Wochen lang kaputtes Code-Update

Altman vor Gericht: "Vertraut mir!"

KI-Agenten spielen dumm — Forscher schlagen Alarm