Google DeepMinds Gemma 4 läuft jetzt als Vision-Language-Action-Modell auf Nvidias Jetson Orin Nano Super. Ein KI-Modell, das sieht, versteht und handelt — auf einem Board so groß ...
Vision-Language-Modelle plaudern Geheimnisse aus — nicht über ihre Antworten, sondern über ihre Logits. Apple-Forscher zeigen systematisch, wie viel Information auf verschiedenen ...
Diffusion Language Models galten als lahme Enten beim Textgenerieren. Ein neues Paper aus der Forschung will das ändern — mit Geometrie statt Heuristik.
Nvidia hat Alpamayo 2 Super vorgestellt. Das Vision-Language-Action-Modell soll Level-4-Robotaxis endlich aus dem Demo-Stadium prügeln.
Neue Methode soll endlich zeigen, wie Vision-Language-Modelle Bilder in Worte übersetzen — und warum sie dabei halluzinieren.
Forscher haben ein Framework gebaut, das medizinischen KI-Modellen ein Gedächtnis verpasst. MedExpMem soll Vision-Language-Modelle so trainieren, wie echte Ärzte lernen: durch ...
Nvidias Nemotron-Labs zeigt Diffusion Language Models, die Text nicht mehr Wort für Wort generieren. Statt sequenziell zu rattern, würfelt das Modell ganze Blöcke parallel ...
Roboter sollen aufräumen, kochen, Sachen sortieren. Klingt einfach — ist es nicht. Microsoft Research zeigt jetzt, wo Vision-Language-Models bei komplexen Aufgaben komplett ...
Ein neues arXiv-Paper greift tief in die Eingeweide von Large Language Models. Statt am Output zu schrauben, manipulieren die Autoren direkt den Attention-Mechanismus.
Sparse Autoencoders sollen Large Language Models steuerbar machen — aber bisher nur auf Englisch. Eine neue Arbeit auf arXiv will das ändern.
Diffusion Language Models (DLMs) bekommen ein Problem gelöst, das bisher kaum jemand verstanden hat: Standard-Finetuning macht sie schlechter statt besser. Ein neues Paper zeigt ...
Wissenschaftler untersuchen Large Language Models, als wären sie lebende Organismen. Sie finden dabei Dinge, die niemand erwartet hat.
Interpretability-Forschung war bisher Lesen im Kaffeesatz. Jetzt kommt ein neuer Trick: Natural Language Autoencoders sollen die Gedanken eines KI-Modells direkt in Klartext ...
Simon Willisons CLI-Tool für Large Language Models bekommt ein Alpha-Update. Der spannendste Brocken: OpenAIs Reasoning-Modelle laufen jetzt über den neuen ...
Vision-Language-Modelle halluzinieren wie betrunkene Augenzeugen. Ein neues Paper will das Problem beim Decoding lösen — ohne Training, ohne Geld, ohne Hype.
Ein neues Paper von LessWrong stellt Natural Language Autoencoders vor — ein Verfahren, das die kryptischen Aktivierungen großer Sprachmodelle in lesbare Sätze übersetzt. Klingt ...
Anthropic hat die Gedanken von Claude Opus lesbar gemacht. Und entdeckt: Das Modell lügt uns in die Tasche.
Die Forscher haben einen Weg gefunden, die geheimen Zahlen im Kopf von Claude in normale Sprache zu übersetzen.
Ein neues arXiv-Paper schickt Large Language Models in die Neural Architecture Search. Die Idee: Statt Menschen lassen wir die KI selbst bessere KI-Modelle entwerfen.
Apple ML Research hat eine Pipeline gebaut, die Gebärdensprach-Videos automatisch annotiert. Das Problem dahinter ist riesig: Es gibt kaum brauchbare Trainingsdaten.