Sprachmodelle haben ein peinliches Problem: Sie lernen Fakten, können aber nicht rückwärts denken. Ein neues Paper zeigt, wie man das mit Rechenzeit zur Inferenz flicken kann.
Inference-Time Scaling ist der neue Hebel der KI-Branche. Statt größere Modelle zu bauen, lässt man bestehende Modelle einfach länger nachdenken. Sebastian Raschka hat die ...
Bonner Forscher haben Transformer-Modelle umgebaut. Die dürfen jetzt selbst entscheiden, wie lange sie über eine Aufgabe grübeln. Ergebnis: Kleine Modelle schlagen deutlich ...
Ein Team aus Bonn hat Transformer-Modelle gebaut, die selbst entscheiden, wie lange sie über eine Aufgabe grübeln. Das Ergebnis: Kleine Modelle schlagen deutlich größere — ...
OpenAI veröffentlicht GPU-Kernel, die eine fast vergessene Netzwerk-Architektur wiederbeleben: Block-Sparse Networks. Die Rechenzeit? Teilweise um Größenordnungen schneller als ...
Sprachmodelle sollen jetzt Forschungsideen bewerten — bevor auch nur ein einziges Experiment läuft. Ein neues arXiv-Paper testet, ob LMs den Erfolg von KI-Forschung vorhersagen ...
Anthropic schnappt sich Compute-Kapazität bei Elon Musks SpaceX. Preisschild: knapp 45 Milliarden Dollar.
Ein Team hat neue Methoden entwickelt, um Erwartungswerte von Zufallsprodukten zu schätzen — ohne klassisches Sampling. Klingt trocken? Ist es auch. Aber relevant.
Forscher stellen den Code für "3D Gaussian Splatting" frei. Diese Technik erzeugt atemberaubende 3D-Szenen aus einfachen Videos. Und das in Echtzeit.
Microsoft Research hat GridSFM vorgestellt — ein kleines Foundation Model, das den AC Optimal Power Flow in Millisekunden berechnet. Klingt nerdig, geht aber um Milliarden.
Wissenschaftler haben einen neuen Weg gefunden, riesige KI-Modelle effizienter zu trainieren. Sie tricksen die Hardware mit einem cleveren mathematischen Kniff.
Ein neues arXiv-Paper schickt Large Language Models in die Neural Architecture Search. Die Idee: Statt Menschen lassen wir die KI selbst bessere KI-Modelle entwerfen.
Endlich Schluss mit ständigem Nachfragen. Google bringt Webhooks für seine Gemini API.
Ein neues Paper auf arXiv schlägt ein Framework vor, das die Länge von KI-Antworten auf Token-Ebene vorhersagt. Klingt nerdig — könnte aber Inferenz-Kosten massiv drücken.
Ein neues arXiv-Paper packt ein altes Problem an: Physics-Informed Neural Networks müssen für jede Aufgabe neu trainiert werden. Die Autoren wollen das mit Compositional ...
Ein neues Paper auf arXiv will Neural Networks beim Training live überwachen — bevor sie kollabieren. Das Werkzeug heißt Collapse Index. Klingt nach Sci-Fi, ist aber Mathematik.
Sam Altmans Geldmaschine stottert. OpenAI hat im ersten Quartal 2026 die selbst gesteckten Umsatz- und Nutzerziele gerissen — und das ausgerechnet mitten im Wettlauf zum IPO.
Forscher haben ein neues Framework für Multi-Task-Optimierung vorgestellt. MONET soll dort ansetzen, wo bisherige Algorithmen an ihre Grenzen stoßen — bei richtig vielen Aufgaben ...
Google DeepMind hat ein Problem gelöst, das die gesamte KI-Branche plagt: Was passiert, wenn mitten im Training ein Chip ausfällt? Bisher: alles steht still. Jetzt nicht mehr.
Together AI hat ein Problem gelöst, von dem die meisten nicht mal wissen, dass es existiert: den Rollout-Flaschenhals beim Reinforcement Learning. Ihre Lösung heißt ...