Suche: ARC

AGENTS

ARC-AGI-3: Alle Top-Modelle scheitern unter 1 Prozent

Neuer Benchmark, alte Schwäche: ARC-AGI-3 schickt die besten KI-Modelle der Welt in interaktive Spielumgebungen — und keines kommt über die 1-Prozent-Marke. Aufgaben, die Menschen ...

The Decoder · 2026-03-26 14:21:07.333560+00:00 · Score 7/10

EXPERIMENTAL

ARC tüftelt an Mathe-Tricks für neuronale Netze

Paul Christianos Alignment-Bude ARC hat ein neues Paper rausgehauen. Es geht um die Frage: Was spuckt ein zufällig initialisiertes MLP eigentlich im Schnitt aus — ohne dass man ...

AI Alignment Forum · 2026-05-07 19:21:42.703425+00:00 · Score 2/10

AGENTS

Frontier-Modelle scheitern an Kinder-Puzzles

OpenAIs GPT-5.5 und Anthropics Opus 4.7 holen im ARC-AGI-3-Benchmark unter 1 Prozent. Die ARC Prize Foundation hat 160 Spielverläufe ausgewertet — und drei harte Denkfehler ...

The Decoder · 2026-05-02 13:18:18.641242+00:00 · Score 7/10

EXPERIMENTAL

ARC zahlt $100.000 für besseres Schätzen

Das Alignment Research Center startet einen Wettbewerb. Ziel: bessere Algorithmen, um das Verhalten zufälliger neuronaler Netze vorherzusagen — ohne sie laufen zu lassen.

AI Alignment Forum · 2026-06-02 22:21:01.743297+00:00 · Score 2/10

EXPERIMENTAL

Neuro-symbolische KI knackt Logik-Rätsel besser

Ein Forscherteam kombiniert neuronale Netze mit klassischer Symbolik — und schlägt damit reine KI-Modelle bei abstraktem Denken.

arXiv AI/ML/NLP · 2026-04-06 13:20:10.673716+00:00 · Score 2/10

EXPERIMENTAL

Nimbus will der Claude-Code-Browser werden

Auf Product Hunt taucht ein neuer Agentic Browser namens Nimbus auf. Das Versprechen: Browser-UX wie Claude Code, nur fürs Web.

Product Hunt AI · 2026-05-16 01:20:50.398375+00:00 · Score 3/10

SKILLS

Google baut Prompt-Speicher direkt in Chrome ein

Google hat ein neues Feature für seinen Browser vorgestellt: Skills in Chrome. Ab dem 14. April 2026 können Nutzer ihre meistgenutzten KI-Prompts als wiederverwendbare ...

MarkTechPost · 2026-04-15 07:16:11.645197+00:00 · Score 7/10

SUCHE

ARC-AGI-3: Alle Top-Modelle scheitern unter 1 Prozent

ARC tüftelt an Mathe-Tricks für neuronale Netze

Frontier-Modelle scheitern an Kinder-Puzzles

ARC zahlt $100.000 für besseres Schätzen

Neuro-symbolische KI knackt Logik-Rätsel besser

Nimbus will der Claude-Code-Browser werden

Google baut Prompt-Speicher direkt in Chrome ein