Suche: Entropie

EXPERIMENTAL

Warum LLMs beim Denken ihre Entropie senken

Forscher haben eine Theorie, warum man großen Sprachmodellen beim Nachdenken zusehen kann — direkt an ihren internen Wahrscheinlichkeiten.

arXiv AI/ML/NLP · 2026-04-09 04:20:51.029283+00:00 · Score 2/10

EXPERIMENTAL

Forscher mixen LLM-Daten mit Geometrie-Trick

Ein neues Paper auf arXiv will das Daten-Mischen für KI-Training neu erfinden. Der Name: GEM. Klingt nach Edelstein, ist aber Mathematik.

arXiv AI/ML/NLP · 2026-05-27 07:18:59.255267+00:00 · Score 2/10

EXPERIMENTAL

Forscher entlarven Chain-of-Thought-Mythos

Eine neue arXiv-Studie zerlegt das heilige Reasoning-Mantra der KI-Welt. Chain-of-Thought bringt oft nichts — kostet aber Tokens ohne Ende.

arXiv AI/ML/NLP · 2026-05-25 10:21:21.555313+00:00 · Score 2/10

EXPERIMENTAL

Forscher zertrümmern KI-Bottleneck mit GPU-Hack

Ein KI-Forschungsteam hat den Sinkhorn-Algorithmus, ein zentrales Werkzeug des Maschinellen Lernens, auf der GPU zerlegt. Ihr Trick: Sie nutzen die versteckte Rechenkraft ...

arXiv AI/ML/NLP · 2026-05-05 07:23:44.612986+00:00 · Score 2/10

EXPERIMENTAL

KV-Cache-Kompression knackt die Shannon-Grenze

Forscher haben eine neue Methode gefunden, den KV-Cache von Transformern zu schrumpfen — und zwar über das bisherige theoretische Limit hinaus.

arXiv AI/ML/NLP · 2026-04-20 07:16:55.795006+00:00 · Score 4/10

EXPERIMENTAL

Diffusion-Modelle lernen jetzt logisch denken

Masked Diffusion Language Models generieren Text nicht Wort für Wort, sondern demaskieren ganze Sequenzen parallel. Problem: Die logisch wichtigsten Wörter kommen dabei zuletzt — ...

arXiv AI/ML/NLP · 2026-03-31 07:22:39.242605+00:00 · Score 2/10

SUCHE

Warum LLMs beim Denken ihre Entropie senken

Forscher mixen LLM-Daten mit Geometrie-Trick

Forscher entlarven Chain-of-Thought-Mythos

Forscher zertrümmern KI-Bottleneck mit GPU-Hack

KV-Cache-Kompression knackt die Shannon-Grenze

Diffusion-Modelle lernen jetzt logisch denken