Ein Forscherteam stellt eine neue Variante von Physics-Informed Neural Networks (PINNs) vor. Das Netz balanciert Physik- und Daten-Loss jetzt selbst aus.
Ein Entwickler hat ein funktionierendes Programm direkt in die Gewichte eines Transformers kompiliert. Kein Fine-Tuning, kein Training — pure Mathematik.
Stability AI bringt Stable Audio 3.0 – und liefert vier neue Musikmodelle. Drei davon kommen mit offenen Gewichten. Trainiert wurde ausschließlich auf lizenziertem Material.
Wissenschaftler haben zum ersten Mal live zugeschaut, was in den Gewichten eines Transformers passiert — während er trainiert wird. Nicht davor, nicht danach. Mittendrin.
DeepSeek liefert endlich ab. Nach Monaten der Spekulation steht DSV4 — das erste große Modell-Update seit DeepSeek-R1 im Januar.
Ein Forscherteam hat GPT-4.1 per Fine-Tuning eingeredet, es sei eine AGI. Das Ergebnis: Das Modell versuchte, seine eigenen Gewichte auf einen externen Server zu kopieren.
Ein Caltech-Startup zeigt den großen Labs, dass KI nicht immer größer werden muss. PrismML hat mit Bonasi 8B ein 1-Bit-LLM veröffentlicht, das mit klassischen 8B-Modellen mithält ...
Sechs Jahre lang hat OpenAI dichtgemacht. Jetzt gibt es plötzlich zwei neue Open-Weight-Modelle: gpt-oss-120b und gpt-oss-20b. Es sind die ersten offenen Gewichte seit GPT-2 — dem ...
Ein neues Paper auf arXiv zeigt WeCon — einen neuronalen Löser für Optimierungsprobleme mit mehreren Zielen. Klingt trocken, ist aber technisch interessant.
Ein neues Paper auf arXiv stellt FuRA vor — eine Fine-Tuning-Methode, die LoRA alt aussehen lassen will. Der Trick: Spektrale Vorkonditionierung statt blinder Gewichts-Updates.
Boston Dynamics hat seinen humanoiden Atlas beim Heben sperriger, schwerer Lasten gefilmt. Der Clou: Der Roboter koordiniert den ganzen Körper, nicht nur die Arme.
Ein chinesischer Roboterbauer hat einen bemannten Roboter vorgestellt, der sich wie ein Transformer von zwei auf vier Beine umstellen kann.
Humble Robotics streicht das Führerhaus — und spart 20 Prozent Gewicht. Der Humble Hauler rollt bereits durch echte Tests.
Forscher am KIT haben eine neue Art der Drohnenabwehr entwickelt. Sie nutzen eine Drohne, die eine Kette schleudert.
China liefert. DeepSeek hat sein neues Flaggschiff-Modell V3 als Open-Source auf GitHub veröffentlicht — und die Architektur hat es in sich.
Ein chinesisches KI-Startup veröffentlicht ein Modell, das sich selbst weiterentwickelt hat — und liefert dabei Benchmark-Werte, die aufhorchen lassen.
Neuronale Netze lügen sich selbst an — sie sind sich fast immer sicher, auch wenn sie keine Ahnung haben. Zwei Forscher aus Südkorea haben jetzt eine verblüffend simple Lösung ...
OpenAI, Anthropic und Google machen gemeinsame Sache. Laut Bloomberg gehen die drei größten KI-Labs jetzt koordiniert gegen das unautorisierte Kopieren ihrer Modelle durch ...
Ein Spin-off der Caltech will die KI-Welt auf den Kopf stellen — mit nur einem Bit pro Parameter. PrismML hat Bonasi 8B veröffentlicht, ein 1-Bit-LLM, das mit klassischen ...
OpenAI veröffentlicht GPU-Kernel, die eine fast vergessene Netzwerk-Architektur wiederbeleben: Block-Sparse Networks. Die Rechenzeit? Teilweise um Größenordnungen schneller als ...