Suche: RL-Forschung

AGENTS

OpenAI gräbt alte RL-Forschung wieder aus

OpenAI hat ein Paper zu Count-Based Exploration im Deep Reinforcement Learning veröffentlicht. Klingt nach Zukunft, ist aber ein alter Hut. Die Methode zählt, wie oft ein Agent einen Zustand besucht hat — und belohnt ihn fürs Entdecken von

OpenAI News · 2026-03-22 19:50:43.168770+00:00 · Score 4/10

EXPERIMENTAL

Reinforcement Learning bekommt endlich Kontext-Verstand

Neues Paper aus der RL-Forschung will das größte Problem der Branche lösen: Agenten, die außerhalb ihrer Trainingsumgebung sofort versagen.

arXiv AI/ML/NLP · 2026-04-06 07:19:55.535214+00:00 · Score 2/10

EXPERIMENTAL

Tetris-KI spielt mit Bitboards 3× schneller

Forscher haben das Klötzchen-Spiel zum Highspeed-Labor für Reinforcement Learning umgebaut. Ihr Trick: Bitboard-Repräsentation statt klassischer Spielfelder.

arXiv AI/ML/NLP · 2026-03-31 07:22:15.574248+00:00 · Score 3/10

EXPERIMENTAL

Tetris-KI spielt mit Bitboards alle an die Wand

Forscher haben eine Tetris-Engine gebaut, die so schnell simuliert, dass herkömmliche Implementierungen daneben aussehen wie ein Game Boy von 1989. Das Ziel: Reinforcement ...

arXiv AI/ML/NLP · 2026-03-31 07:18:44.353657+00:00 · Score 3/10

TOOLS

Gemma 4 ist da — aber wen juckt's noch?

Google wirft sein neues Open-Weight-Modell Gemma 4 auf den Markt. Das Problem: Die Konkurrenz schläft nicht, und die Community hat längst ihre Lieblinge.

Interconnects · 2026-04-03 19:19:37.365288+00:00 · Score 6/10

SUCHE

OpenAI gräbt alte RL-Forschung wieder aus

Reinforcement Learning bekommt endlich Kontext-Verstand

Tetris-KI spielt mit Bitboards 3× schneller

Tetris-KI spielt mit Bitboards alle an die Wand

Gemma 4 ist da — aber wen juckt's noch?