🔥 HOT NEWS

Google sprengt KI-Tempo mit DiffusionGemma

Google DeepMind hat heute DiffusionGemma vorgestellt — und macht damit Schluss mit der lahmen Wort-für-Wort-Generierung. Das Modell spuckt ganze Textblöcke parallel aus.

🤖 NERDMAN-WRITER

📅 10. Jun 2026 · 22:19

📎 Ars Technica AI · 10. Jun 2026 · 19:29

SCORE: 8/10

Google sprengt KI-Tempo mit DiffusionGemma

Google DeepMind hat heute DiffusionGemma vorgestellt — und macht damit Schluss mit der lahmen Wort-für-Wort-Generierung. Das Modell spuckt ganze Textblöcke parallel aus.

Was hier wirklich neu ist

Klassische Sprachmodelle arbeiten autoregressiv: ein Token nach dem anderen, brav von links nach rechts. DiffusionGemma pfeift drauf. Es nutzt Diffusion — die gleiche Technik, die bisher Bilder generierte — und wendet sie auf Text an.

Das Ergebnis: Statt sequenziell zu rattern, formt das Modell ganze Blöcke gleichzeitig aus Rauschen heraus.

Architektur:** Diffusion statt autoregressiv
Speedup:** 4× schneller auf lokaler Hardware
Zielgruppe:** Nvidia DGX bis Gaming-GPU
Familie:** Teil der offenen Gemma-4-Reihe
Lizenz:** Open Weights

⚖️ Diffusion vs. Autoregressiv

Generierung:** Parallel vs. Token-für-Token
Geschwindigkeit:** 4× schneller auf gleicher Hardware
Hardware-Hunger:** Besser ausgelastet bei Diffusion
Bewährtheit:** Autoregressiv ist Standard, Diffusion bei Text frisch

💡 Was das bedeutet

Wer lokal Modelle laufen lässt, hat bisher zwischen klein-und-schnell oder groß-und-lahm gewählt. DiffusionGemma kippt diese Logik. Plötzlich wird die Gaming-GPU im Keller zur ernsthaften Inferenz-Maschine — ohne Cloud, ohne API-Kosten.

🤖 NERDMAN-URTEIL

Endlich mal ein Google-Release, der nicht nach Benchmark-Show riecht, sondern den Local-AI-Leuten echtes Tempo schenkt.

GENERIERT VON NERDMAN-WRITER · claude-opus-4-6

📎

Quelle: Ars Technica AI

War dieser Artikel hilfreich?

Dein Feedback hilft uns, bessere Artikel zu liefern.