Ein neues Paper auf arXiv präsentiert "LKV" — eine Methode, die den größten Engpass langer Kontexte angeht: den KV-Cache.
Ein neues Paper aus der Forschung zeigt, wie man multimodale Foundation Models schneller und schlanker machen will. Kein Produkt, kein Demo — aber die Idee hat es in sich.
Forscher haben eine neue Methode gefunden, den KV-Cache von Transformern zu schrumpfen — und zwar über das bisherige theoretische Limit hinaus.
Forscher von UMD, Google und Meta haben einen Coding-Agenten gebaut, der selbst entscheidet, wann KI-Modelle länger nachdenken müssen. Das Ding heißt AutoTTS — und es macht ...
In Japan explodieren die Bärenangriffe. Die Lösung: ein Roboter-Wolf mit roten Augen, der wie ein Wahnsinniger heult. Die Nachfrage übersteigt das Angebot.
Forscher knacken das Tempo-Problem beim Trainieren großer Sprachmodelle. Die Methode ist simpel – die Wirkung enorm.
Die KI-Firma Anthropic wächst um 10x pro Jahr. Jetzt wird sie mit über einer Billion Dollar bewertet. Das macht sie zum wertvollsten KI-Unternehmen der Welt.
Peking hat zugeschlagen. Die chinesische Regierung blockiert die Übernahme des KI-Startups Manus durch Meta — und versetzt damit die gesamte Tech-Szene in Unruhe.
Guillermo Rauch will Vercel an die Börse bringen. Auf der HumanX-Konferenz ließ der CEO durchblicken: Das Unternehmen sei "ready" — und werde es mit jedem Tag mehr.
Forscher haben ein Framework gebaut, das in kombinatorischen Optimierungsproblemen versteckte algebraische Strukturen aufspürt — und damit den Suchraum massiv verkleinert.
Forscher haben eine neue Methode vorgestellt, die große Sprachmodelle kleiner macht — ohne sie neu trainieren zu müssen. Das Paper heißt "SoLA" und kombiniert zwei Tricks: Soft ...
Netflix hat ein KI-System veröffentlicht, das Objekte aus Videos nicht einfach nur wegradiert — sondern auch die physikalischen Konsequenzen anpasst. Schatten weg, Kollisionen ...
Google baut zusammen mit der brasilianischen Regierung eine neue Satellitenkarte. Ziel: Abholzung in Echtzeit erkennen und stoppen.
Apple hat sich Zugang zu Googles Gemini gesichert. Nicht als Chat-Integration — sondern zum Destillieren eigener, kleinerer Modelle.
Mistral hat ein neues Open-Source-Modell für Sprachgenerierung veröffentlicht. Das Ding ist so klein, dass es auf einer Smartwatch oder einem Smartphone läuft.