Diffusion Language Models galten als lahme Enten beim Textgenerieren. Ein neues Paper aus der Forschung will das ändern — mit Geometrie statt Heuristik.
Roboter sollen aufräumen, kochen, Sachen sortieren. Klingt einfach — ist es nicht. Microsoft Research zeigt jetzt, wo Vision-Language-Models bei komplexen Aufgaben komplett ...
NVIDIA stellt GR00T N1.7 auf Hugging Face — ein Open-Weight-Modell, das Humanoide Roboter sehen, verstehen und handeln lässt. Kein Closed-Source-Geheimnis, sondern frei verfügbar.
Audio war immer das Stiefkind der multimodalen KI. Bilder verstehen? Kein Problem. Aber Sprache, Musik und Umgebungsgeräusche gleichzeitig verarbeiten? Daran scheitern die meisten ...
Ein neues Paper will Large Language Models auf Graphen-Daten trainieren, ohne tausende Labels zu brauchen. Der Trick: Ein Graph Neural Network spielt den Lehrer.
Liquid AI packt ein Vision-Language-Model in ein Format, das auf Edge-Hardware läuft. Das neue LFM2.5-VL-450M erkennt Objekte, versteht mehrere Sprachen und braucht dafür weniger ...
Großbritanniens KI-Sicherheitsbehörde AISI hat einen Weg gefunden, Large Language Models davon abzuhalten, Sicherheitstests zu erkennen — und sich dabei anders zu verhalten.
Forscher haben Large Language Models auf echte Onkologie-Patientenakten losgelassen. Ergebnis: Die KI fischt Tumor-Daten aus Arzt-Notizen, die bisher in Freitext versauerten.
Forscher lassen Large Language Models auf 136 Fallberichte von Typ-2-Diabetes-Patienten los. Ziel: Klinische Ereignisse automatisch auf einer Zeitachse sortieren — damit aus ...
Wenn dein Internet stirbt, soll künftig eine KI den Fehler finden. Forscher haben untersucht, ob Large Language Models bei der Root Cause Analysis (RCA) von Netzwerk-Ausfällen ...
Ein Fisch soll uns zeigen, wie Sprachmodelle wirklich ticken. GuppyLM ist ein bewusst winziges Language Model — gebaut nicht für Performance, sondern für Verständnis.
Forscher haben ein Problem gelöst, das Masked Diffusion Language Models (MDLMs) bisher ausgebremst hat: Jeder Generierungsschritt brauchte das volle, fette Transformer-Modell. Das ...
Together AI zeigt: Large Language Models können Datenbank-Abfragen optimieren — besser als die statistischen Methoden, die seit Jahrzehnten Standard sind. Bis zu 4,78x Speedup. ...
Forscher haben Large Language Models beigebracht, Störungen in Lieferketten vorherzusagen. Nicht mit klassischer Statistik, sondern mit Sprachmodellen, die aus verrauschten, ...
OpenAI-Präsident Greg Brockman hat die Debatte um die Grenzen von Large Language Models für beendet erklärt. Seine These: Textmodelle allein reichen aus, um generelle künstliche ...
Masked Diffusion Language Models generieren Text nicht Wort für Wort, sondern demaskieren ganze Sequenzen parallel. Problem: Die logisch wichtigsten Wörter kommen dabei zuletzt — ...
Vision-Language-Modelle liefern Top-Scores auf Englisch. Aber fragt man sie auf Hindi oder Tamil, wird's peinlich.
DeepSeek hat ein neues Open-Source-Repo veröffentlicht: Engram. Die Idee dahinter: Large Language Models brauchen neben Mixture-of-Experts eine zweite Spar-Achse — und die heißt ...
Tencent AI Lab stellt Covo-Audio als Open Source bereit. Ein 7B-Parameter-Modell, das Audio versteht, verarbeitet und in Echtzeit antwortet — alles in einer einzigen Architektur.
Thomson Reuters macht ernst. Der Daten-Gigant entwickelt ein eigenes Large Language Model namens „Thomson" — speziell trainiert auf juristische Inhalte. Launch: diesen Sommer.