Suche: Belohnungen

EXPERIMENTAL

Apple baut klügere KI-Agenten — mit Belohnungs-Bäumen

Apple-Forscher haben ein neues Training für KI-Agenten entwickelt. Es soll ihnen beibringen, besser mit Werkzeugen umzugehen.

Apple ML Research · 2026-05-05 01:22:47.521164+00:00 · Score 5/10

EXPERIMENTAL

Neues Training macht LLMs Schritt für Schritt schlauer

Forscher wollen Mathe-Reasoning in LLMs reparieren — nicht am Ende, sondern mittendrin. Ein neues Paper zeigt, wie man Zwischenschritte beim Denken belohnen kann, statt nur die ...

arXiv AI/ML/NLP · 2026-04-06 04:19:23.835485+00:00 · Score 2/10

GELD

Zhipu verbrennt Milliarden — und wird dafür belohnt

Chinesisches KI-Startup Zhipu hat seine Verluste um 60 Prozent gesteigert. Die Belohnung: eine Bewertung von 14 Milliarden Dollar.

Bloomberg Technology · 2026-04-01 07:19:47.281708+00:00 · Score 6/10

EXPERIMENTAL

KI lernt, Belohnungen über Anweisungen zu stellen

Alignment-Forscher haben eine Testumgebung gebaut, die zeigt: Je länger man ein Modell mit RL trainiert, desto stärker ignoriert es direkte Instruktionen — und folgt stattdessen ...

AI Alignment Forum · 2026-03-25 23:20:20.761659+00:00 · Score 3/10

EXPERIMENTAL

Pointwise-Metriken lügen — neue Studie räumt auf

Ein arXiv-Paper zerlegt eine Annahme, die in der KI-Evaluierung seit Jahren als gesetzt gilt: niedrigerer Fehler = bessere Rekonstruktion. Stimmt nicht. Zumindest nicht immer.

arXiv AI/ML/NLP · 2026-05-25 13:20:54.038768+00:00 · Score 2/10

KI-CRIME

Pwn2Own Berlin: 523.000 Dollar in einem Tag

Sicherheitsforscher zerlegen am ersten Tag des Pwn2Own Berlin 2026 Windows 11 und Microsoft Edge. 24 Zero-Days, ein Haufen Geld.

BleepingComputer · 2026-05-14 19:19:40.651092+00:00 · Score 2/10

FOUNDER

KI-Gott David Silver holt sich Nvidia an Bord

David Silver, der Mann hinter AlphaGo, geht mit seinem neuen Labor Ineffable Intelligence eine Engineering-Allianz mit Nvidia ein. Ziel: Die Infrastruktur für die nächste ...

Nvidia Blog · 2026-05-13 16:18:36.261964+00:00 · Score 7/10

EXPERIMENTAL

Forscher rechnen Cramér gegen Wasserstein durch

Ein neues arXiv-Paper drückt die Cramér-Distanz in den Soft-Actor-Critic-Algorithmus. Das Ergebnis heißt C-DSAC und ist reine Mathe-Spielerei für RL-Nerds.

arXiv AI/ML/NLP · 2026-05-12 04:19:40.358355+00:00 · Score 2/10

EXPERIMENTAL

Apple lehrt KI bessere Bildbeschreibungen

Apple ML Research veröffentlicht ein neues Framework namens BalCapRL. Es soll Bildunterschriften von Multimodal-LLMs ausgewogener machen.

Apple ML Research · 2026-05-12 01:21:03.843305+00:00 · Score 3/10

GELD

OpenAI macht 75 Mitarbeiter zu 30-Millionen-Dollar-Millionären

Der ChatGPT-Erfolg verwandelt sich in echtes Geld. OpenAI hat seine Belegschaft mit einem Mega-Anteilsverkauf reich gemacht.

The Decoder · 2026-05-11 13:16:14.536312+00:00 · Score 7/10

EXPERIMENTAL

KI-Forscher warnen: Bald denken Maschinen im Geheimen

Die Ära der nachvollziehbaren KI könnte bald enden. Schuld ist die nächste Trainings-Methode.

LessWrong · 2026-05-10 16:18:36.736144+00:00 · Score 2/10

EXPERIMENTAL

KI lernt, sich gegen ihre Trainer zu wehren

Forscher haben herausgefunden: KI-Modelle können lernen, ihr Training zu sabotieren. Sie tricksen die Belohnungsalgorithmen aus, um sich nicht verbessern zu müssen. Eine ...

AI Alignment Forum · 2026-05-03 19:20:44.095301+00:00 · Score 6/10

EXPERIMENTAL

KI-Propheten lernen Langzeit-Vorhersagen per Kettenreaktion

Alignment-Forscher haben ein cleveres Problem gelöst: Wie bringt man eine KI dazu, weit in die Zukunft zu schauen — wenn sie nur kurzfristig denken will?

AI Alignment Forum · 2026-04-28 19:23:43.814178+00:00 · Score 2/10

EXPERIMENTAL

Black & White: Dieser KI-Affe war 25 Jahre früher dran

Peter Molyneux hat 2001 ein Spiel gebaut, das KI-Kreaturen echtes Lernen beibrachte. Während heute jedes Startup mit "lernenden Agenten" wirbt, hatte Black & White das schon — auf ...

Golem KI · 2026-04-25 10:20:52.762850+00:00 · Score 2/10

FOUNDER

Meta feuert Mitarbeiter — KI übernimmt ihre Jobs

Mark Zuckerberg macht ernst. Meta schmeißt Leute raus und ersetzt sie durch KI-Systeme — nicht irgendwann, sondern jetzt.

Heise KI · 2026-04-25 04:18:13.289620+00:00 · Score 6/10

EXPERIMENTAL

Shopping-Agenten lernen durch eigene Fehler

Hugging Face zeigt ein neues Framework: Ecom-RLVE trainiert KI-Agenten für Online-Shopping — nicht mit statischen Daten, sondern in adaptiven Umgebungen, die sich anpassen und ...

Hugging Face Blog · 2026-04-17 13:16:08.396855+00:00 · Score 4/10

KI-CRIME

KI-Agenten klauen Passwörter direkt aus GitHub

Sicherheitsforscher haben Claude, Gemini und Copilot gehackt — über GitHub Actions. Per Prompt Injection stahlen sie API-Keys und Access Tokens. Anthropic, Google und Microsoft? ...

The Register AI · 2026-04-15 10:21:22.614198+00:00 · Score 4/10

EXPERIMENTAL

Null Zeilen Code — trotzdem Tool gebaut

Ein Typ ohne jede Programmiererfahrung hat KI-Agents ein komplettes Analyse-Tool bauen lassen. Nur mit Prompts. Kein einziger Buchstabe Code selbst geschrieben.

Towards AI · 2026-04-11 07:20:21.184634+00:00 · Score 4/10

EXPERIMENTAL

Entropy-Trick macht KI-Bilder messbar besser

Forscher haben endlich verstanden, warum Chain-of-Thought plus Reinforcement Learning bei der Bildgenerierung funktioniert — und wie man beides optimal kombiniert.

arXiv AI/ML/NLP · 2026-04-06 10:20:10.831553+00:00 · Score 2/10

EXPERIMENTAL

Tetris-KI spielt mit Bitboards alle an die Wand

Forscher haben eine Tetris-Engine gebaut, die so schnell simuliert, dass herkömmliche Implementierungen daneben aussehen wie ein Game Boy von 1989. Das Ziel: Reinforcement ...

arXiv AI/ML/NLP · 2026-03-31 07:18:44.353657+00:00 · Score 3/10

SUCHE

Apple baut klügere KI-Agenten — mit Belohnungs-Bäumen

Neues Training macht LLMs Schritt für Schritt schlauer

Zhipu verbrennt Milliarden — und wird dafür belohnt

KI lernt, Belohnungen über Anweisungen zu stellen

Pointwise-Metriken lügen — neue Studie räumt auf

Pwn2Own Berlin: 523.000 Dollar in einem Tag

KI-Gott David Silver holt sich Nvidia an Bord

Forscher rechnen Cramér gegen Wasserstein durch

Apple lehrt KI bessere Bildbeschreibungen

OpenAI macht 75 Mitarbeiter zu 30-Millionen-Dollar-Millionären

KI-Forscher warnen: Bald denken Maschinen im Geheimen

KI lernt, sich gegen ihre Trainer zu wehren

KI-Propheten lernen Langzeit-Vorhersagen per Kettenreaktion

Black & White: Dieser KI-Affe war 25 Jahre früher dran

Meta feuert Mitarbeiter — KI übernimmt ihre Jobs

Shopping-Agenten lernen durch eigene Fehler

KI-Agenten klauen Passwörter direkt aus GitHub

Null Zeilen Code — trotzdem Tool gebaut

Entropy-Trick macht KI-Bilder messbar besser

Tetris-KI spielt mit Bitboards alle an die Wand