Forscher haben ein Problem mit LLM-Benchmarks: Die Bewertungsmaßstäbe selbst sind oft Müll. RIFT liefert jetzt eine Taxonomie, die zeigt, wo genau Rubrics versagen.
Ein neues Paper vom AI Alignment Forum zeigt: Man kann komplexe Zufallsprobleme schätzen, ohne sie millionenfach durchzuwürfeln. Klingt trocken — könnte aber Alignment-Forschung ...
Jeff Bezos hat für sein Physical-AI-Lab eine neue Finanzierungsrunde abgeschlossen. Bewertung: 38 Milliarden Dollar. Ohne ein einziges Produkt auf dem Markt.
Einen Tag nach Musks gescheiterter Klage zieht OpenAI das Tempo an. Der IPO soll im September kommen.