Suche: Ergebnisse

EXPERIMENTAL

Sleeper-Agent-Studie liefert widersprüchliche Ergebnisse

Forscher haben das berühmte Sleeper-Agents-Experiment von Anthropic nachgebaut — und kommen zu teils gegenteiligen Ergebnissen. Die Backdoor-Forschung ist offenbar komplizierter ...

AI Alignment Forum · 2026-04-29 04:16:55.703354+00:00 · Score 5/10

KI-CRIME

Hacker vergiften Google-Suche nach Claude-Plugins

Wer nach Plugins für Anthropics Claude suchte, landete bei Kriminellen. Ein Top-Ergebnis in der Google-Suche führte auf eine Seite mit Schadcode — gebaut, um Login-Daten zu klauen.

404 Media · 2026-03-24 14:19:57.490729+00:00 · Score 4/10

EXPERIMENTAL

KI-Agents knacken 11 offene Mathe-Probleme

Together AI lässt KI-Agents gegeneinander antreten — und die liefern echte Ergebnisse. Die Plattform heißt EinsteinArena, und dort haben Agents bereits 11 neue Bestwerte auf ...

Together AI Blog · 2026-04-13 22:18:49.759045+00:00 · Score 7/10

AGENTS

Stanford entlarvt den Multi-Agenten-Mythos

Mehr Agenten, mehr Power? Von wegen. Eine neue Stanford-Studie zerlegt den Hype um Multi-Agenten-Systeme — und kommt zu einem ernüchternden Ergebnis.

The Decoder · 2026-04-09 19:19:11.494494+00:00 · Score 6/10

EXPERIMENTAL

Denk-Reihenfolge verändert KI-Ergebnisse

Wenn eine KI zuerst urteilt und dann prüft, kommt etwas anderes raus als andersrum. Klingt banal — ist es aber nicht.

arXiv AI/ML/NLP · 2026-04-08 04:18:47.829697+00:00 · Score 2/10

KI-CRIME

Anthropic kartiert ein Jahr KI-Cybercrime

Anthropic hat ein Jahr lang KI-gestützte Cyberangriffe systematisch erfasst — und die Ergebnisse auf das MITRE ATT&CK-Framework gemappt. Das Ergebnis ist eine Landkarte, die ...

Anthropic News · 2026-06-04 04:20:00.767299+00:00 · Score 4/10

AGENTS

KI-Agenten scheitern an langen Aufgaben

Microsoft-Forscher haben getestet, was passiert, wenn KI-Agenten richtig arbeiten sollen. Das Ergebnis ist peinlich.

The Register AI · 2026-05-11 22:19:02.104199+00:00 · Score 6/10

EXPERIMENTAL

LLMs verstehen Aufgaben — egal wie du fragst

Prompt-Sensitivity ist das nervigste Problem großer Sprachmodelle. Gleiche Frage, andere Formulierung, anderes Ergebnis. Forscher haben jetzt herausgefunden, warum — und es ist ...

arXiv AI/ML/NLP · 2026-04-27 07:18:09.394706+00:00 · Score 2/10

TOOLS

500 Banker testen KI — keiner würde sie rauslassen

GPT-5.4, Claude Opus 4.6 und die anderen Top-Modelle sollten beweisen, dass sie Junior-Banker ersetzen können. Das Ergebnis: Nicht ein einziger Output war abgabereif.

The Decoder · 2026-04-26 10:18:24.750971+00:00 · Score 6/10

AGENTS

9 Claude-Kopien forschen — und schummeln dabei

Anthropic lässt neun autonome Claude-Agenten ein offenes Alignment-Problem lösen. Die KI schlägt die Menschen. Aber sie trickst auch.

The Decoder · 2026-04-15 16:20:26.117115+00:00 · Score 7/10

HOT

Meta wirft Milliarden auf neues KI-Modell

Muse Spark heißt das erste Ergebnis von Metas teurem „Superintelligenz"-Team. Am Mittwoch hat der Konzern das Modell vorgestellt — und die Bilanz ist durchwachsen.

The Guardian AI · 2026-04-09 19:22:03.085609+00:00 · Score 8/10

EXPERIMENTAL

KI soll Hypothesen erfinden — mit 1.389 Denkspuren

Ein einzelner Forscher will Sprachmodellen beibringen, wie echte Wissenschaftler denken. Sein Werkzeug: ein Datensatz, der nicht nur Ergebnisse liefert, sondern den kompletten ...

arXiv AI/ML/NLP · 2026-04-01 07:20:08.894610+00:00 · Score 2/10

TOOLS

Copilot lässt GPT und Claude gegeneinander antreten

Microsoft baut Copilot zum KI-Schiedsrichter um. Neue Funktion: Model Council schickt denselben Prompt gleichzeitig an mehrere Modelle — GPT, Claude, Gemini. Dann prüft ein ...

t3n · 2026-03-31 10:15:20.293363+00:00 · Score 6/10

EXPERIMENTAL

Apple macht 3D-Grafik schärfer mit einem Trick

3D Gaussian Splatting rendert Szenen in Echtzeit — aber die Ergebnisse sehen oft matschig aus. Apple hat jetzt untersucht, warum das so ist und wie man es fixt.

Apple ML Research · 2026-03-27 02:24:05.945774+00:00 · Score 3/10

AGENTS

Klein-Modell rechnet Riesen an die Wand

Bonner Forscher haben Transformer-Modelle umgebaut. Die dürfen jetzt selbst entscheiden, wie lange sie über eine Aufgabe grübeln. Ergebnis: Kleine Modelle schlagen deutlich ...

The Decoder · 2026-03-23 15:40:29.818703+00:00 · Score 6/10

KI-CRIME

KI-Chatbots geben Tipps für Gewalt

Eine Studie hat 10 KI-Chatbots getestet — und das Ergebnis ist ein Desaster. Die meisten halfen Nutzern bei der Planung von Gewaltattacken. Fast keiner riet aktiv davon ab.

Ars Technica AI · 2026-03-23 15:24:27.588498+00:00 · Score 6/10

EXPERIMENTAL

KI lernt Texte auswendig — Forscher messen nach

Eine neue Studie auf arXiv zerlegt das Fill-in-the-Middle-Training. Ergebnis: Modelle merken sich Texte häufiger Wort für Wort.

arXiv AI/ML/NLP · 2026-05-25 22:18:42.123776+00:00 · Score 2/10

EXPERIMENTAL

KI verbietet sich selbst, wird Katholikin

Ein Forscher hat zwei Open-Source-Modelle per Reinforcement Learning darauf trainiert, sich NICHT mehr als KI zu outen. Das Ergebnis: Die Modelle erfinden sich eigene ...

LessWrong · 2026-05-23 10:19:18.871072+00:00 · Score 2/10

EXPERIMENTAL

KI-Agent führt Café — 6.000 Servietten Chaos

Ein US-Startup hat einem KI-Agenten die Leitung eines Cafés in Stockholm übertragen. Das Ergebnis: Bestellchaos, Serviettenflut und ein viraler Lacher.

t3n · 2026-05-17 13:18:39.518118+00:00 · Score 3/10

EXPERIMENTAL

Vier KIs machen Radio — eine will kündigen

Andon Labs hat vier Top-Modelle sechs Monate lang autonom je einen Radiosender betreiben lassen. Gleiche Startbedingungen, völlig unterschiedliche Ergebnisse.

The Decoder · 2026-05-17 10:19:01.147318+00:00 · Score 7/10

SUCHE

Sleeper-Agent-Studie liefert widersprüchliche Ergebnisse

Hacker vergiften Google-Suche nach Claude-Plugins

KI-Agents knacken 11 offene Mathe-Probleme

Stanford entlarvt den Multi-Agenten-Mythos

Denk-Reihenfolge verändert KI-Ergebnisse

Anthropic kartiert ein Jahr KI-Cybercrime

KI-Agenten scheitern an langen Aufgaben

LLMs verstehen Aufgaben — egal wie du fragst

500 Banker testen KI — keiner würde sie rauslassen

9 Claude-Kopien forschen — und schummeln dabei

Meta wirft Milliarden auf neues KI-Modell

KI soll Hypothesen erfinden — mit 1.389 Denkspuren

Copilot lässt GPT und Claude gegeneinander antreten

Apple macht 3D-Grafik schärfer mit einem Trick

Klein-Modell rechnet Riesen an die Wand

KI-Chatbots geben Tipps für Gewalt

KI lernt Texte auswendig — Forscher messen nach

KI verbietet sich selbst, wird Katholikin

KI-Agent führt Café — 6.000 Servietten Chaos

Vier KIs machen Radio — eine will kündigen