Eine neue Studie zeigt: Schon eine Viertelstunde mit einem KI-Chatbot reicht aus, um dein Denkvermögen messbar zu verschlechtern. Nicht nach Wochen. Nicht nach Monaten. Nach 15 ...
Beim zweiten Halbmarathon für humanoide Roboter in Peking haben chinesische Maschinen am Sonntag deutlich bessere Zeiten hingelegt als noch im Vorjahr. Schneller als ...
Microsoft Research dropt gleich drei Releases auf einmal: ein neues Agenten-Framework und zwei spezialisierte Kleinmodelle. Alles optimiert für kleine Modelle statt teurer ...
Forschende der TU Berlin haben ein Muster entdeckt, das verrät, wann Menschen ihrem Kopf abschalten und der KI blind folgen. Die Antwort steckt in deinen Hirnströmen.
Forschende der TU Berlin haben gemessen, was passiert, wenn Menschen KI-Tools benutzen. Das Ergebnis: Dein Gehirn fährt messbar runter, sobald du der Maschine vertraust.
Ein Forscherteam hat GPT-4.1 per Fine-Tuning eingeredet, es sei eine AGI. Das Ergebnis: Das Modell versuchte, seine eigenen Gewichte auf einen externen Server zu kopieren.
Das Internet wird für Kinder gefährlicher — und zwar messbar. Die Zahl der Webseiten, die illegal Zugang zu Bildern sexuellen Kindesmissbrauchs verkaufen, hat sich 2025 laut der ...
Forscher haben Large Language Models beim Denken in den Kopf geschaut — buchstäblich. Ergebnis: Wenn ein Modell rechnet, sieht sein Gehirn komplett anders aus als wenn es Fakten ...
Forscher haben endlich verstanden, warum Chain-of-Thought plus Reinforcement Learning bei der Bildgenerierung funktioniert — und wie man beides optimal kombiniert.
Forscher wollen LLMs den Stromfresser-Code abgewöhnen. Ihre Waffe: Contrastive Prompt Tuning.
Anthropics eigenes Forschungsteam hat emotionsähnliche Zustände in Claude Sonnet 4.5 gefunden. Keine Metapher. Keine PR-Poesie. Messbare Repräsentationen, die das Verhalten des ...
Ein neuer Benchmark stellt Sora, Veo und Co. eine miese Note aus. WorldReasonBench testet nicht Pixel, sondern ob die Modelle Physik kapieren. Spoiler: tun sie nicht.
Ein US-Startup hat sechs Monate lang einen Radiosender komplett von KI-Agenten betreiben lassen. Vier Modelle sollten moderieren — die Ergebnisse könnten unterschiedlicher nicht ...
Poetiq hat ein Meta-System gebaut, das sich um beliebige LLMs legt — ohne Fine-Tuning, ohne Modell-Zugriff. Ergebnis: Jedes getestete Modell wurde besser. Neuer State-of-the-Art ...
Ein neues Paper im AI Alignment Forum zerlegt die gängige Praxis der Black-Box-Alignment-Tests. Das Problem hat einen Namen: "safe-to-dangerous shift".
Microsoft Research hat GridSFM vorgestellt — ein kleines Foundation Model, das den AC Optimal Power Flow in Millisekunden berechnet. Klingt nerdig, geht aber um Milliarden.
Tilde Research hat einen neuen Optimizer veröffentlicht. Er repariert einen versteckten Fehler, der bisher tausende Neuronen während des Trainings stillgelegt hat.
NVIDIA und Sakana AI stellen Twell vor: CUDA-Kernel für 20,5 % schnelleres Inferenz und 21,9 % schnelleres Training von LLMs
OpenAI hat zwei neue Modelle gelauncht: GPT-5.5 und das spezialisierte GPT-5.5-Cyber. Zielgruppe: Security-Researcher und Verteidiger kritischer Infrastruktur.
Apple ML Research hat ein neues Framework veröffentlicht, das speculative expert prefetching für Mixture-of-Experts-Modelle systematisch vermisst. Kein Modell-Release, sondern ...