Suche: GPT-2

EXPERIMENTAL

GPT-4 erklärt jedes Neuron in GPT-2

OpenAI lässt ein KI-Modell die Gehirnzellen eines anderen KI-Modells erklären. Klingt nach Science-Fiction, ist aber ein echtes Forschungsprojekt.

OpenAI News · 2026-03-23 03:19:48.521984+00:00 · Score 4/10

HOT

Anthropic hält sein stärkstes Modell zurück

Anthropic hat ein neues Modell gebaut — und gibt es niemandem. Claude Mythos ist das erste KI-Modell seit GPT-2, das bewusst nicht öffentlich zugänglich gemacht wird.

Zvi Mowshowitz · 2026-04-09 22:18:28.536534+00:00 · Score 9/10

TOOLS

OpenAI verschenkt erstmals wieder KI-Modelle

Nach fast 7 Jahren Schweigen macht OpenAI die Tür wieder auf. Mit gpt-oss-120b und gpt-oss-20b veröffentlicht der ChatGPT-Konzern seine ersten Open-Weight-Modelle seit GPT-2 im ...

Ahead of AI (Raschka) · 2026-03-23 15:34:42.219766+00:00 · Score 7/10

EXPERIMENTAL

Forscher zerlegen GPT-2 in 32.000 Hirn-Features

Neue Studie auf arXiv knackt das Rätsel, warum LLM-Mittelschichten so verdammt gut Gehirnaktivität vorhersagen. Antwort: Sparse Autoencoders.

arXiv AI/ML/NLP · 2026-05-26 01:19:27.423253+00:00 · Score 2/10

FOUNDER

Altman erklärt Safety-Exodus mit "Vibes"

Sam Altman hat eine Erklärung für die Massenflucht der Safety-Forscher bei OpenAI. Und die ist so dünn wie ein GPT-2-Prompt.

The Decoder · 2026-04-06 19:15:59.988273+00:00 · Score 7/10

AGENTS

OpenAI will starke KI mit schwacher KI kontrollieren

OpenAI stellt eine neue Forschungsrichtung für Superalignment vor. Die Kernfrage: Können schwache Modelle stärkere Modelle beaufsichtigen — und funktioniert das überhaupt?

OpenAI News · 2026-03-23 06:20:25.511108+00:00 · Score 6/10

HOT

OpenAI öffnet sich: Erste Open-Weight-Modelle seit 2019

Sechs Jahre lang hat OpenAI dichtgemacht. Jetzt gibt es plötzlich zwei neue Open-Weight-Modelle: gpt-oss-120b und gpt-oss-20b. Es sind die ersten offenen Gewichte seit GPT-2 — dem ...

Ahead of AI (Raschka) · 2026-03-22 00:51:19.320947+00:00 · Score 8/10

EXPERIMENTAL

OpenAI ließ KI Mozart und Beatles mixen

OpenAI stellte mit MuseNet ein Modell vor, das 4-Minuten-Stücke mit bis zu 10 Instrumenten komponiert. Von Country bis Klassik — alles aus einem Transformer.

OpenAI News · 2026-03-22 21:18:48.104218+00:00 · Score 5/10

EXPERIMENTAL

NanoGPT-Training in 90 Sekunden geknackt

Ein Open-Source-Speedrun jagt den schnellsten Trainings-Algorithmus für GPT-2-Niveau. Aktueller Rekord: 90 Sekunden auf 8 H100s.

GitHub Trending Python · 2026-04-30 04:15:58.259755+00:00 · Score 2/10

TOOLS

Raschka vergleicht alle LLM-Architekturen auf einen Blick

Sebastian Raschka hat seinen massiven Architektur-Vergleich großer Sprachmodelle aktualisiert. Von GPT-2 bis DeepSeek V3 und Llama 4 — alles in einer Übersicht. Neu dabei: ...

Ahead of AI (Raschka) · 2026-03-22 00:51:06.205132+00:00 · Score 6/10

EXPERIMENTAL

KI spricht jetzt wie 1930

Drei Forscher haben ein Sprachmodell gebaut, das nur Text von vor 1931 kennt. 13 Milliarden Parameter, trainiert auf 260 Milliarden Tokens — alles aus einer Zeit, als Radio noch ...

Simon Willison · 2026-04-28 04:15:27.062184+00:00 · Score 7/10

EXPERIMENTAL

KI-Agent baut komplette RISC-V-CPU allein

Ein Startup behauptet, eine komplette CPU nur durch KI entworfen zu haben. Kein menschlicher Chip-Designer hat Hand angelegt — nur ein agentenbasiertes System.

IEEE Spectrum AI · 2026-04-23 01:20:06.007711+00:00 · Score 8/10

HOT

OpenAI bringt drei neue Sprach-Modelle

OpenAI dreht beim Voice-Game auf. Drei neue Audio-Modelle sollen Live-Gespräche auf GPT-5-Niveau bringen.

The Decoder · 2026-05-07 19:18:17.168377+00:00 · Score 9/10

HOT

Google wirft DiffusionGemma raus — 4× schneller

Google DeepMind hat ein neues Open-Model gedroppt: DiffusionGemma, ein 26B-MoE-Modell, das Text per Diffusion generiert — nicht autoregressiv. Apache 2.0. Frei für alle.

MarkTechPost · 2026-06-10 19:22:09.271559+00:00 · Score 7/10

EXPERIMENTAL

NorBERTo schluckt 331 Milliarden Tokens

Forscher haben einen neuen Encoder für brasilianisches Portugiesisch gebaut. Er heißt NorBERTo und basiert auf der ModernBERT-Architektur.

arXiv AI/ML/NLP · 2026-05-04 07:20:30.746849+00:00 · Score 2/10

HOT

Google wirft DiffusionGemma in die Arena

Google hat ein offenes Sprachmodell mit 26 Milliarden Parametern veröffentlicht — und es schreibt Text auf eine Art, die so noch kein Big-Tech-Lab gewagt hat.

The Decoder · 2026-06-10 22:19:40.301450+00:00 · Score 8/10

GELD

Recursive kassiert 4,65 Milliarden für Selbstverbesserung

Das Stealth-Startup Recursive ist raus aus dem Versteck — und kassiert direkt eine Mega-Bewertung. Das Versprechen: rekursive Selbstverbesserung als "schnellster Weg zur ...

The Decoder · 2026-05-13 13:19:06.849298+00:00 · Score 7/10

HOT

Anthropic hält Claude Mythos zurück

Anthropic hat ein neues Modell namens Claude Mythos Preview angekündigt — und sagt im selben Atemzug, es sei zu mächtig für die Öffentlichkeit.

Bloomberg Technology · 2026-05-07 01:19:13.723043+00:00 · Score 6/10

BULLSHIT

Anthropic hält KI zurück — Forscher widerlegen den Grund

Anthropic sagt: Unser Cybersecurity-Modell „Claude Mythos" ist zu gefährlich für die Öffentlichkeit. Klingt dramatisch. Ist es aber offenbar nicht.

The Decoder · 2026-04-18 10:19:02.645576+00:00 · Score 7/10

HOT

OpenAI schlägt zurück: Neue Voice-Modelle crashen Benchmarks

OpenAI hat gerade drei neue Echtzeit-Voice-Modelle rausgehauen. Die alten waren lahme Ente, die neuen sind Turbo.

Latent Space · 2026-05-08 10:22:14.697191+00:00 · Score 7/10

SUCHE

GPT-4 erklärt jedes Neuron in GPT-2

Anthropic hält sein stärkstes Modell zurück

OpenAI verschenkt erstmals wieder KI-Modelle

Forscher zerlegen GPT-2 in 32.000 Hirn-Features

Altman erklärt Safety-Exodus mit "Vibes"

OpenAI will starke KI mit schwacher KI kontrollieren

OpenAI öffnet sich: Erste Open-Weight-Modelle seit 2019

OpenAI ließ KI Mozart und Beatles mixen

NanoGPT-Training in 90 Sekunden geknackt

Raschka vergleicht alle LLM-Architekturen auf einen Blick

KI spricht jetzt wie 1930

KI-Agent baut komplette RISC-V-CPU allein

OpenAI bringt drei neue Sprach-Modelle

Google wirft DiffusionGemma raus — 4× schneller

NorBERTo schluckt 331 Milliarden Tokens

Google wirft DiffusionGemma in die Arena

Recursive kassiert 4,65 Milliarden für Selbstverbesserung

Anthropic hält Claude Mythos zurück

Anthropic hält KI zurück — Forscher widerlegen den Grund

OpenAI schlägt zurück: Neue Voice-Modelle crashen Benchmarks