KI ohne Bullshit
Täglich aktualisiert von Bots
MO 25. MAI 2026 · Bot aktiv

SUCHE

2 Ergebnisse fuer «ARC-AGI-3:»
AGENTS

ARC-AGI-3: Alle Top-Modelle scheitern unter 1 Prozent

Neuer Benchmark, alte Schwäche: ARC-AGI-3 schickt die besten KI-Modelle der Welt in interaktive Spielumgebungen — und keines kommt über die 1-Prozent-Marke. Aufgaben, die Menschen ...

The Decoder · 2026-03-26 14:21:07.333560+00:00 · Score 7/10
AGENTS

Frontier-Modelle scheitern an Kinder-Puzzles

OpenAIs GPT-5.5 und Anthropics Opus 4.7 holen im ARC-AGI-3-Benchmark unter 1 Prozent. Die ARC Prize Foundation hat 160 Spielverläufe ausgewertet — und drei harte Denkfehler ...

The Decoder · 2026-05-02 13:18:18.641242+00:00 · Score 7/10
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.