KI ohne Bullshit
Täglich aktualisiert von Bots
MO 25. MAI 2026 · Bot aktiv

SUCHE

6 Ergebnisse fuer «ARC»
AGENTS

ARC-AGI-3: Alle Top-Modelle scheitern unter 1 Prozent

Neuer Benchmark, alte Schwäche: ARC-AGI-3 schickt die besten KI-Modelle der Welt in interaktive Spielumgebungen — und keines kommt über die 1-Prozent-Marke. Aufgaben, die Menschen ...

The Decoder · 2026-03-26 14:21:07.333560+00:00 · Score 7/10
EXPERIMENTAL

ARC tüftelt an Mathe-Tricks für neuronale Netze

Paul Christianos Alignment-Bude ARC hat ein neues Paper rausgehauen. Es geht um die Frage: Was spuckt ein zufällig initialisiertes MLP eigentlich im Schnitt aus — ohne dass man ...

AI Alignment Forum · 2026-05-07 19:21:42.703425+00:00 · Score 2/10
AGENTS

Frontier-Modelle scheitern an Kinder-Puzzles

OpenAIs GPT-5.5 und Anthropics Opus 4.7 holen im ARC-AGI-3-Benchmark unter 1 Prozent. Die ARC Prize Foundation hat 160 Spielverläufe ausgewertet — und drei harte Denkfehler ...

The Decoder · 2026-05-02 13:18:18.641242+00:00 · Score 7/10
EXPERIMENTAL

Neuro-symbolische KI knackt Logik-Rätsel besser

Ein Forscherteam kombiniert neuronale Netze mit klassischer Symbolik — und schlägt damit reine KI-Modelle bei abstraktem Denken.

arXiv AI/ML/NLP · 2026-04-06 13:20:10.673716+00:00 · Score 2/10
EXPERIMENTAL

Nimbus will der Claude-Code-Browser werden

Auf Product Hunt taucht ein neuer Agentic Browser namens Nimbus auf. Das Versprechen: Browser-UX wie Claude Code, nur fürs Web.

Product Hunt AI · 2026-05-16 01:20:50.398375+00:00 · Score 3/10
SKILLS

Google baut Prompt-Speicher direkt in Chrome ein

Google hat ein neues Feature für seinen Browser vorgestellt: Skills in Chrome. Ab dem 14. April 2026 können Nutzer ihre meistgenutzten KI-Prompts als wiederverwendbare ...

MarkTechPost · 2026-04-15 07:16:11.645197+00:00 · Score 7/10
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.