Eine Forschergruppe der Hong Kong University hat DeepTutor neu aufgesetzt — komplett umgeschrieben, jetzt mit Agent-Architektur. Version 1.0.0-beta.1 ist seit dem 4. April ...
Sebastian Raschka hat seinen massiven Architektur-Vergleich großer Sprachmodelle aktualisiert. Von GPT-2 bis DeepSeek V3 und Llama 4 — alles in einer Übersicht. Neu dabei: ...
Ein chinesisches KI-Startup veröffentlicht ein Modell, das sich selbst weiterentwickelt hat — und liefert dabei Benchmark-Werte, die aufhorchen lassen.
Chinesische Forscher bauen ein Text-to-Speech-System, das komplett ohne diskrete Token arbeitet. Stattdessen: durchgehende Diffusion, End-to-End, direkt von Text zu Sprache.
Alibaba hat nachgelegt. Das Qwen-Team veröffentlicht Qwen3.5-Omni — ein Modell, das Text, Bild, Audio und Video nativ verarbeitet. Kein Zusammenkleben einzelner Module mehr, ...
Die Ära des Standard-LLM wackelt. Sebastian Raschka, einer der respektiertesten ML-Forscher überhaupt, hat die wichtigsten Alternativen zum klassischen Transformer-Decoder ...
Eine neue Studie schaut nicht darauf, WAS ein Sprachmodell weiß — sondern WIE sich Informationen von Schicht zu Schicht verändern. Klingt abstrakt. Ist es auch.
Qwen liefert. Alibabas KI-Team hat Qwen3.5-Omni veröffentlicht — ein natives Multimodal-Modell, das Text, Bilder, Audio und Video in einer einzigen Architektur verarbeitet. Kein ...
Autonome Fahrzeuge müssen in Millisekunden entscheiden: bremsen, lenken, Gas geben. Avraam Tolmidis zerlegt die technische Architektur hinter diesen Entscheidungen — vom Rohsignal ...
DeepSeek hat ein neues Open-Source-Repo veröffentlicht: Engram. Die Idee dahinter: Large Language Models brauchen neben Mixture-of-Experts eine zweite Spar-Achse — und die heißt ...
Cohere kennt man für Text-Modelle und Embeddings. Jetzt steigt das Unternehmen mit "Cohere Transcribe" in den Markt für automatische Spracherkennung ein.
Tencent AI Lab stellt Covo-Audio als Open Source bereit. Ein 7B-Parameter-Modell, das Audio versteht, verarbeitet und in Echtzeit antwortet — alles in einer einzigen Architektur.
Arm hat in 35 Jahren Firmengeschichte noch nie einen eigenen Chip produziert. Bis jetzt. Der britische Chipdesigner, dessen Architekturen in praktisch jedem Smartphone der Welt ...
Die Open-Source-Szene dreht komplett am Rad. Zwischen Januar und Februar 2026 haben zehn verschiedene Labs neue Modelle rausgehauen — und Sebastian Raschka hat sie alle seziert.
Meta hat Llama 4 veröffentlicht. Die neue Modellgeneration setzt auf Mixture-of-Experts (MoE) und ist multimodal. Together AI bietet die Modelle ab sofort zum Einsatz an.
Eine KI träumt in Klötzchen. Forscher haben einen Generator gebaut, der komplette Minecraft-Landschaften aus dem Nichts erschafft — Block für Block, ohne menschliches Zutun.
Anthropic baut Code-Reviews um. Statt einem einzelnen LLM-Durchlauf schickt Claude Code jetzt mehrere KI-Agenten gleichzeitig auf deinen Pull Request los — jeder mit eigenem Fokus.
Ein Mathe-Paper behauptet: Attention in Transformern, Diffusion-Maps und magnetische Laplacians — alles nur Varianten derselben Markov-Geometrie. Klingt verrückt? Ist es auch.
Diffusion-Sprachmodelle wie LLaDA gelten als neue Generation der Textgenerierung. Ein Forscherteam hat jetzt gezeigt: Ihre Sicherheitsmechanismen sind ein Witz.
Ein neuronales Netz, das nicht auf einem Computer läuft — sondern selbst einer ist. Forscher von Meta AI und der King Abdullah University of Science and Technology (KAUST) haben ...