Ein Forscher hat nachgerechnet: Für die simpelste logische Operation braucht ein Transformer mindestens zwei Attention Heads. Der Beweis? Überraschend einfach.
Eine kritische Auth-Bypass-Lücke im Python-Framework Starlette legt LLM-Gateways und Agent-Infrastruktur frei. Angreifer brauchen nur einen manipulierten Host-Header.
Forscher schlagen vor, den Speicher-Killer von LLMs mit Rate-Distortion-Theorie zu komprimieren. Klingt nach Nerd-Kram. Ist auch Nerd-Kram.
Ein Foto rein, Audio drauf, fertig ist das Talking-Head-Video. Das Tool SadTalker aus dem Tencent AI Lab trendet aktuell auf GitHub — obwohl das Paper schon von 2023 ist.
Ein neues Paper auf arXiv präsentiert "LKV" — eine Methode, die den größten Engpass langer Kontexte angeht: den KV-Cache.
Ein neues Paper auf arXiv schlägt FIRMA vor — ein Protokoll für Federated Learning, das angeblich drei Schwächen gleichzeitig knackt. Klingt nach Mathe-Magie, ist aber pure ...
Alibaba hat einen Prozessor vorgestellt, der speziell für AI Agents gedacht ist. Dazu kommt eine mehrjährige Silicon-Roadmap und ein neues Sprachmodell. Das ist kein Lückenfüller ...
Sebastian Raschka ist zurück aus der Familienpause und liefert einen Überblick, der Engineers aufhorchen lässt. Open-Weight-Modelle schrauben gerade alle am gleichen Problem: ...
Synthetic Design Lab zeigt auf der AACR 2026 eine neue Klasse von Protein-Therapeutika. Die Dinger haben eingebaute Logik-Gatter und ändern ihr Verhalten je nachdem, was sie im ...
Cyberkriminelle missbrauchen die Teilen-Funktion von ChatGPT und Claude. Über harmlos aussehende Chat-Links schleusen sie Schadsoftware an Sicherheitstools vorbei.
BioHub feuert die nächste Salve im KI-Protein-Krieg. Alex Rives bringt mit ESMFold2 ein Modell, das nicht denkt — sondern brutal skaliert.
Ein Pivotal-Mentee-Bewerber will Transformer auf einer Mini-Sprache trainieren, um endlich zu verstehen, was im Inneren passiert. Klingt nerdig — ist es auch.
China liefert. DeepSeek hat sein neues Flaggschiff-Modell V3 als Open-Source auf GitHub veröffentlicht — und die Architektur hat es in sich.
Die KI-Firma hat Führungskräfte-Abgang. Gleich drei Manager verlassen OpenAI.
Simon Willison hat Version 0.25 seines `llm-anthropic`-Plugins veröffentlicht. Mit dabei: Support für Claude Opus 4.7 und ein neuer Thinking-Modus namens `xhigh`.
Teheran fordert, dass Schiffe im Persischen Golf mit digitalen Währungen zahlen. Der Grund ist simpel: Krypto lässt sich nicht so leicht einfrieren wie Dollars.
Während Washington Exportkontrollen verschärft, antwortet Peking mit Hardware. Alibaba hat einen Compute-Cluster mit 10.000 KI-Chips in Betrieb genommen — komplett ohne westliche ...
Niemand hatte das auf dem Zettel. Intel schließt sich Elon Musks Terafab-Projekt an — und die Aktie schießt sofort nach oben.
Simon Willison wollte seine eigene Version von Claude Artifacts bauen. Dabei stellte sich eine Frage: Kann man JavaScript in einem Iframe per CSP-Meta-Tag einsperren — ohne eine ...
DeepSeek hat ein neues Open-Source-Repo veröffentlicht: Engram. Die Idee dahinter: Large Language Models brauchen neben Mixture-of-Experts eine zweite Spar-Achse — und die heißt ...