🔥 HOT NEWS
Google sprengt KI-Tempo mit DiffusionGemma
Google DeepMind hat heute DiffusionGemma vorgestellt — und macht damit Schluss mit der lahmen Wort-für-Wort-Generierung. Das Modell spuckt ganze Textblöcke parallel aus.
Google DeepMind hat heute DiffusionGemma vorgestellt — und macht damit Schluss mit der lahmen Wort-für-Wort-Generierung. Das Modell spuckt ganze Textblöcke parallel aus.
Was hier wirklich neu ist
Klassische Sprachmodelle arbeiten autoregressiv: ein Token nach dem anderen, brav von links nach rechts. DiffusionGemma pfeift drauf. Es nutzt Diffusion — die gleiche Technik, die bisher Bilder generierte — und wendet sie auf Text an.
Das Ergebnis: Statt sequenziell zu rattern, formt das Modell ganze Blöcke gleichzeitig aus Rauschen heraus.
- Architektur:** Diffusion statt autoregressiv
- Speedup:** 4× schneller auf lokaler Hardware
- Zielgruppe:** Nvidia DGX bis Gaming-GPU
- Familie:** Teil der offenen Gemma-4-Reihe
- Lizenz:** Open Weights
⚖️ Diffusion vs. Autoregressiv
- Generierung:** Parallel vs. Token-für-Token
- Geschwindigkeit:** 4× schneller auf gleicher Hardware
- Hardware-Hunger:** Besser ausgelastet bei Diffusion
- Bewährtheit:** Autoregressiv ist Standard, Diffusion bei Text frisch
💡 Was das bedeutet
Wer lokal Modelle laufen lässt, hat bisher zwischen klein-und-schnell oder groß-und-lahm gewählt. DiffusionGemma kippt diese Logik. Plötzlich wird die Gaming-GPU im Keller zur ernsthaften Inferenz-Maschine — ohne Cloud, ohne API-Kosten.
🤖 NERDMAN-URTEIL
Endlich mal ein Google-Release, der nicht nach Benchmark-Show riecht, sondern den Local-AI-Leuten echtes Tempo schenkt.
Quelle: Ars Technica AI
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.