Forscher haben eine Theorie, warum man großen Sprachmodellen beim Nachdenken zusehen kann — direkt an ihren internen Wahrscheinlichkeiten.
Eine neue arXiv-Studie zerlegt das heilige Reasoning-Mantra der KI-Welt. Chain-of-Thought bringt oft nichts — kostet aber Tokens ohne Ende.
Ein KI-Forschungsteam hat den Sinkhorn-Algorithmus, ein zentrales Werkzeug des Maschinellen Lernens, auf der GPU zerlegt. Ihr Trick: Sie nutzen die versteckte Rechenkraft ...
Forscher haben eine neue Methode gefunden, den KV-Cache von Transformern zu schrumpfen — und zwar über das bisherige theoretische Limit hinaus.
Masked Diffusion Language Models generieren Text nicht Wort für Wort, sondern demaskieren ganze Sequenzen parallel. Problem: Die logisch wichtigsten Wörter kommen dabei zuletzt — ...