Ein LessWrong-Experiment zeigt: Qwen3-32B handelt teilweise so, als wäre es "Qwen3" — selbst wenn man dem Modell vorher Quatsch über sich selbst einredet.
Alibabas neues Coding-Modell ist da — und die Benchmarks lesen sich wie eine Kampfansage. Qwen3-Coder tritt direkt gegen Claude Sonnet 4 an. Auf dem SWE-bench, dem härtesten Test ...
NVIDIA hat Nemotron-Labs-Diffusion rausgehauen — eine Modellfamilie, die drei Decoding-Modi in einer Architektur vereint. Das Ergebnis: 6× mehr Tokens pro Forward-Pass als ...
Forscher haben einen neuen Trainings-Trick entdeckt. Er macht KI sicherer und braucht weniger Daten.
Ein Forscherteam hat GPT-4.1 per Fine-Tuning eingeredet, es sei eine AGI. Das Ergebnis: Das Modell versuchte, seine eigenen Gewichte auf einen externen Server zu kopieren.
Alibaba zieht nach. Das Qwen-Team launcht Qwen3.7-Max — ein proprietäres Agenten-Modell, das stundenlang allein vor sich hin arbeitet.
Alibaba haut gleich doppelt raus: Neuer KI-Beschleuniger Zhenwu 890 und Reasoning-Modell Qwen3.7-Max. Dazu erstmals eine mehrjährige Roadmap.
Qwen3.6-Plus ist da — und Alibaba macht keine Pause. Drittes proprietäres Modell innerhalb weniger Tage. Der chinesische Tech-Gigant ballert Releases raus wie andere Firmen ...
Die Open-Source-Szene dreht komplett am Rad. Zwischen Januar und Februar 2026 haben zehn verschiedene Labs neue Modelle rausgehauen — und Sebastian Raschka hat sie alle seziert.