OpenAI hat einen neuronalen Theorembeweiser gebaut. Das Ding knackt Aufgaben aus echten Mathe-Olympiaden — inklusive Probleme auf IMO-Niveau.
Frontier-Modelle wie GPT-4o oder Claude Opus lösen Mathe-Olympiaden und knacken offene Probleme. Aber wer prüft, ob deren Beweise überhaupt stimmen? Ein neues Paper zeigt: Dafür ...