OpenAI lässt ein KI-Modell die Gehirnzellen eines anderen KI-Modells erklären. Klingt nach Science-Fiction, ist aber ein echtes Forschungsprojekt.
Anthropic hat ein neues Modell gebaut — und gibt es niemandem. Claude Mythos ist das erste KI-Modell seit GPT-2, das bewusst nicht öffentlich zugänglich gemacht wird.
Nach fast 7 Jahren Schweigen macht OpenAI die Tür wieder auf. Mit gpt-oss-120b und gpt-oss-20b veröffentlicht der ChatGPT-Konzern seine ersten Open-Weight-Modelle seit GPT-2 im ...
Sam Altman hat eine Erklärung für die Massenflucht der Safety-Forscher bei OpenAI. Und die ist so dünn wie ein GPT-2-Prompt.
OpenAI stellt eine neue Forschungsrichtung für Superalignment vor. Die Kernfrage: Können schwache Modelle stärkere Modelle beaufsichtigen — und funktioniert das überhaupt?
Sechs Jahre lang hat OpenAI dichtgemacht. Jetzt gibt es plötzlich zwei neue Open-Weight-Modelle: gpt-oss-120b und gpt-oss-20b. Es sind die ersten offenen Gewichte seit GPT-2 — dem ...
OpenAI stellte mit MuseNet ein Modell vor, das 4-Minuten-Stücke mit bis zu 10 Instrumenten komponiert. Von Country bis Klassik — alles aus einem Transformer.
Ein Open-Source-Speedrun jagt den schnellsten Trainings-Algorithmus für GPT-2-Niveau. Aktueller Rekord: 90 Sekunden auf 8 H100s.
Sebastian Raschka hat seinen massiven Architektur-Vergleich großer Sprachmodelle aktualisiert. Von GPT-2 bis DeepSeek V3 und Llama 4 — alles in einer Übersicht. Neu dabei: ...
Drei Forscher haben ein Sprachmodell gebaut, das nur Text von vor 1931 kennt. 13 Milliarden Parameter, trainiert auf 260 Milliarden Tokens — alles aus einer Zeit, als Radio noch ...
Ein Startup behauptet, eine komplette CPU nur durch KI entworfen zu haben. Kein menschlicher Chip-Designer hat Hand angelegt — nur ein agentenbasiertes System.
OpenAI dreht beim Voice-Game auf. Drei neue Audio-Modelle sollen Live-Gespräche auf GPT-5-Niveau bringen.
Forscher haben einen neuen Encoder für brasilianisches Portugiesisch gebaut. Er heißt NorBERTo und basiert auf der ModernBERT-Architektur.
Das Stealth-Startup Recursive ist raus aus dem Versteck — und kassiert direkt eine Mega-Bewertung. Das Versprechen: rekursive Selbstverbesserung als "schnellster Weg zur ...
Anthropic hat ein neues Modell namens Claude Mythos Preview angekündigt — und sagt im selben Atemzug, es sei zu mächtig für die Öffentlichkeit.
Anthropic sagt: Unser Cybersecurity-Modell „Claude Mythos" ist zu gefährlich für die Öffentlichkeit. Klingt dramatisch. Ist es aber offenbar nicht.
OpenAI hat gerade drei neue Echtzeit-Voice-Modelle rausgehauen. Die alten waren lahme Ente, die neuen sind Turbo.
Die Chinesen legen wieder vor. DeepSeek hat sein neues Flaggschiff-Modell veröffentlicht. Ein Jahr nach ihrem letzten Durchbruch geht es direkt gegen GPT und Claude.