Bei Meta gibt es jetzt eine interne Rangliste für KI-Token-Verbrauch. Wer am meisten raushaut, bekommt Titel. Nicht wer am besten arbeitet — wer am meisten verbraucht.
Hugging Face zeigt ein neues Framework: Ecom-RLVE trainiert KI-Agenten für Online-Shopping — nicht mit statischen Daten, sondern in adaptiven Umgebungen, die sich anpassen und ...
Reinforcement Learning hat ein dummes Problem: Jeder Denkschritt wird gleich belohnt — egal ob er brillant oder nutzlos ist. Alibabas Qwen-Team hat einen Algorithmus gebaut, der ...
Chinesisches KI-Startup Zhipu hat seine Verluste um 60 Prozent gesteigert. Die Belohnung: eine Bewertung von 14 Milliarden Dollar.
OpenAI hat ein Paper zu Count-Based Exploration im Deep Reinforcement Learning veröffentlicht. Klingt nach Zukunft, ist aber ein alter Hut. Die Methode zählt, wie oft ein Agent einen Zustand besucht hat — und belohnt ihn fürs Entdecken von
Rockstar Games wurde gehackt — und hat nicht gezahlt. Jetzt stehen die Daten im Netz.
ChatGPT, Claude, Gemini — sie alle zitieren fleißig. Jetzt zeigt eine Mega-Analyse mit 15 Millionen Quellenverweisen, woher die Chatbots ihr Wissen wirklich holen.
Das Pentagon stellte Anthropic-CEO Dario Amodei ein Ultimatum: Entferne die Sicherheitsschranken von Claude für autonome Waffen und Massenüberwachung. Amodei lehnte ab.
Ein Musiker hat mit gefälschten Streams und KI-generierten Songs über zehn Millionen Dollar von Streaming-Diensten abgezogen. Jetzt hat er gestanden.
OpenAI hat ein Modell trainiert, das mathematische Probleme auf neuem Rekordniveau löst. Der Trick: Nicht die Antwort zählt, sondern jeder einzelne Denkschritt.