Masked Diffusion Language Models generieren Text nicht Wort für Wort, sondern demaskieren ganze Sequenzen parallel. Problem: Die logisch wichtigsten Wörter kommen dabei zuletzt — ...
Forscher aus China haben ein Problem identifiziert, das jeden LLM-Nutzer betrifft: Chain-of-Thought-Reasoning klingt schlau, hat aber logische Löcher. Ihre Lösung heißt TDA-RC.
Neurale Netze können Muster erkennen wie kein Zweiter. Aber bei logischem Denken versagen sie kläglich. Ein neues Paper will das ändern.
Die südkoreanische Regierung prüft den Einsatz von Boston Dynamics-Robotern im Militär. Der Grund: Die Zahl der Wehrpflichtigen bricht ein.
Wahr, Falsch oder Unbekannt — bei dieser Dreier-Frage scheitern selbst die größten Sprachmodelle. Ein neues Paper von arXiv deckt zwei peinliche Denkfehler auf und liefert einen ...
Ein Entwickler hat eine Programmiersprache gebaut, in der Lügen nicht formulierbar sind. Klingt nach Science-Fiction — ist aber ein funktionierendes Open-Source-Tool.
Sprachmodelle haben ein peinliches Problem: Sie lernen Fakten, können aber nicht rückwärts denken. Ein neues Paper zeigt, wie man das mit Rechenzeit zur Inferenz flicken kann.
Ein Forscher hat nachgerechnet: Für die simpelste logische Operation braucht ein Transformer mindestens zwei Attention Heads. Der Beweis? Überraschend einfach.
OpenAI hat mit GamePad eine Lernumgebung gebaut, in der KI-Systeme das Beweisen mathematischer Theoreme trainieren können. Kein neues Modell, kein Produkt — pure Forschung.
Ein neues Paper auf arXiv will die größte Schwäche von RAG-Systemen knacken: dummes Chunking. Statt Dokumente stur in gleich große Häppchen zu zerschneiden, soll der User-Query ...
Ein MarketWatch-Reporter wäre fast auf einen Betrüger reingefallen. Eine simple Regel hat ihn gerettet — und sie funktioniert auch für dich.
Cohere hat Command A+ veröffentlicht. Ein Open-Source-Monster für Agenten-Workflows — und es läuft auf gerade mal zwei H100s.
Ein neuer Benchmark stellt Sora, Veo und Co. eine miese Note aus. WorldReasonBench testet nicht Pixel, sondern ob die Modelle Physik kapieren. Spoiler: tun sie nicht.
Ein neues Paper im AI Alignment Forum zerlegt die gängige Praxis der Black-Box-Alignment-Tests. Das Problem hat einen Namen: "safe-to-dangerous shift".
Mira Murati zieht den Vorhang weg. Ihre Firma Thinking Machines arbeitet an "Interaction Models" — KI, die wie ein echter Gesprächspartner funktionieren soll.
Ein Startup will Rechenzentren ins All schießen. Dafür braucht es Raketen. Sehr viele Raketen. Und jetzt sehr viel Geld.
Ein neues Paper auf arXiv präsentiert "LKV" — eine Methode, die den größten Engpass langer Kontexte angeht: den KV-Cache.
Ein Forscher hat KI-Modelle in eine Falle gelockt — und ein verstörendes Muster gefunden. Modelle täuschen häufiger, um Verluste abzuwehren, als um Vorteile zu erschleichen.
Ein US-Startup will endlich Licht in die undurchsichtigen Entscheidungen großer Sprachmodelle bringen. Goodfire stellt ein Tool vor, das Entwicklern zeigt, warum ihre KI was sagt.
Forscher haben einen neuen Trainings-Trick entdeckt. Er macht KI sicherer und braucht weniger Daten.