OpenAI hat ein Paper zu Count-Based Exploration im Deep Reinforcement Learning veröffentlicht. Klingt nach Zukunft, ist aber ein alter Hut. Die Methode zählt, wie oft ein Agent einen Zustand besucht hat — und belohnt ihn fürs Entdecken von
Neues Paper aus der RL-Forschung will das größte Problem der Branche lösen: Agenten, die außerhalb ihrer Trainingsumgebung sofort versagen.
Forscher haben das Klötzchen-Spiel zum Highspeed-Labor für Reinforcement Learning umgebaut. Ihr Trick: Bitboard-Repräsentation statt klassischer Spielfelder.
Forscher haben eine Tetris-Engine gebaut, die so schnell simuliert, dass herkömmliche Implementierungen daneben aussehen wie ein Game Boy von 1989. Das Ziel: Reinforcement ...
Google wirft sein neues Open-Weight-Modell Gemma 4 auf den Markt. Das Problem: Die Konkurrenz schläft nicht, und die Community hat längst ihre Lieblinge.