Suche: Heads

EXPERIMENTAL

XOR braucht 2 Attention Heads — Beweis mit Schulmathe

Ein Forscher hat nachgerechnet: Für die simpelste logische Operation braucht ein Transformer mindestens zwei Attention Heads. Der Beweis? Überraschend einfach.

LessWrong · 2026-04-03 01:20:41.035555+00:00 · Score 2/10

KI-CRIME

BadHost-Lücke kapert AI-Agenten weltweit

Eine kritische Auth-Bypass-Lücke im Python-Framework Starlette legt LLM-Gateways und Agent-Infrastruktur frei. Angreifer brauchen nur einen manipulierten Host-Header.

InfoQ AI/ML · 2026-06-01 16:20:20.452312+00:00 · Score 4/10

EXPERIMENTAL

RateQuant quetscht KV-Cache mit Mathe-Trick

Forscher schlagen vor, den Speicher-Killer von LLMs mit Rate-Distortion-Theorie zu komprimieren. Klingt nach Nerd-Kram. Ist auch Nerd-Kram.

arXiv AI/ML/NLP · 2026-05-11 04:19:07.850518+00:00 · Score 2/10

EXPERIMENTAL

SadTalker macht Fotos zum sprechenden Kopf

Ein Foto rein, Audio drauf, fertig ist das Talking-Head-Video. Das Tool SadTalker aus dem Tencent AI Lab trendet aktuell auf GitHub — obwohl das Paper schon von 2023 ist.

GitHub Trending Python · 2026-05-11 04:18:19.401066+00:00 · Score 3/10

EXPERIMENTAL

Forscher schrumpfen LLM-Speicherfresser per Lernverfahren

Ein neues Paper auf arXiv präsentiert "LKV" — eine Methode, die den größten Engpass langer Kontexte angeht: den KV-Cache.

arXiv AI/ML/NLP · 2026-05-11 04:19:23.906006+00:00 · Score 2/10

EXPERIMENTAL

Forscher lösen Federated-Learning-Trilemma mit Fibonacci

Ein neues Paper auf arXiv schlägt FIRMA vor — ein Protokoll für Federated Learning, das angeblich drei Schwächen gleichzeitig knackt. Klingt nach Mathe-Magie, ist aber pure ...

arXiv AI/ML/NLP · 2026-05-25 13:21:35.087288+00:00 · Score 2/10

HOT

Alibaba baut Chip nur für KI-Agenten

Alibaba hat einen Prozessor vorgestellt, der speziell für AI Agents gedacht ist. Dazu kommt eine mehrjährige Silicon-Roadmap und ein neues Sprachmodell. Das ist kein Lückenfüller ...

AI News · 2026-05-21 01:21:02.475281+00:00 · Score 7/10

EXPERIMENTAL

LLMs lernen Sparen — drei neue Architektur-Tricks

Sebastian Raschka ist zurück aus der Familienpause und liefert einen Überblick, der Engineers aufhorchen lässt. Open-Weight-Modelle schrauben gerade alle am gleichen Problem: ...

Ahead of AI (Raschka) · 2026-05-16 13:18:21.731511+00:00 · Score 4/10

EXPERIMENTAL

KI-Medikamente denken jetzt selbst nach

Synthetic Design Lab zeigt auf der AACR 2026 eine neue Klasse von Protein-Therapeutika. Die Dinger haben eingebaute Logik-Gatter und ändern ihr Verhalten je nachdem, was sie im ...

The AI Journal · 2026-04-20 01:15:28.655639+00:00 · Score 5/10

KI-CRIME

Hacker kapern ChatGPT-Links für Malware

Cyberkriminelle missbrauchen die Teilen-Funktion von ChatGPT und Claude. Über harmlos aussehende Chat-Links schleusen sie Schadsoftware an Sicherheitstools vorbei.

The Decoder · 2026-05-30 13:18:58.287381+00:00 · Score 4/10

HOT

ESMFold2 knackt Proteine mit der Bitter Lesson

BioHub feuert die nächste Salve im KI-Protein-Krieg. Alex Rives bringt mit ESMFold2 ein Modell, das nicht denkt — sondern brutal skaliert.

Latent Space · 2026-05-27 19:18:59.695235+00:00 · Score 8/10

EXPERIMENTAL

Forscher will KI-Gehirn mit Spielzeug-Sprache zerlegen

Ein Pivotal-Mentee-Bewerber will Transformer auf einer Mini-Sprache trainieren, um endlich zu verstehen, was im Inneren passiert. Klingt nerdig — ist es auch.

LessWrong · 2026-05-01 22:19:16.222920+00:00 · Score 2/10

HOT

DeepSeek-V3 bringt 671 Milliarden Parameter

China liefert. DeepSeek hat sein neues Flaggschiff-Modell V3 als Open-Source auf GitHub veröffentlicht — und die Architektur hat es in sich.

GitHub Trending Python · 2026-04-26 04:15:28.885943+00:00 · Score 8/10

FOUNDER

OpenAI: Drei Manager fliehen

Die KI-Firma hat Führungskräfte-Abgang. Gleich drei Manager verlassen OpenAI.

The Decoder · 2026-04-18 10:21:57.721347+00:00 · Score 7/10

TOOLS

llm-anthropic 0.25 bringt Claude Opus 4.7

Simon Willison hat Version 0.25 seines `llm-anthropic`-Plugins veröffentlicht. Mit dabei: Support für Claude Opus 4.7 und ein neuer Thinking-Modus namens `xhigh`.

Simon Willison · 2026-04-16 22:19:08.674676+00:00 · Score 6/10

KI-CRIME

Iran will Öl-Zölle in Krypto kassieren

Teheran fordert, dass Schiffe im Persischen Golf mit digitalen Währungen zahlen. Der Grund ist simpel: Krypto lässt sich nicht so leicht einfrieren wie Dollars.

Bloomberg Technology · 2026-04-14 19:21:03.478214+00:00 · Score 2/10

HOT

Alibaba feuert 10.000 Chips gegen Amerika

Während Washington Exportkontrollen verschärft, antwortet Peking mit Hardware. Alibaba hat einen Compute-Cluster mit 10.000 KI-Chips in Betrieb genommen — komplett ohne westliche ...

SCMP Tech · 2026-04-08 10:15:20.306837+00:00 · Score 6/10

HOT

Intel steigt bei Musks Terafab ein

Niemand hatte das auf dem Zettel. Intel schließt sich Elon Musks Terafab-Projekt an — und die Aktie schießt sofort nach oben.

Bloomberg Technology · 2026-04-08 04:17:54.940730+00:00 · Score 7/10

EXPERIMENTAL

CSP im Iframe: Willisons Sandbox-Trick funktioniert

Simon Willison wollte seine eigene Version von Claude Artifacts bauen. Dabei stellte sich eine Frage: Kann man JavaScript in einem Iframe per CSP-Meta-Tag einsperren — ohne eine ...

Simon Willison · 2026-04-03 19:16:48.035376+00:00 · Score 2/10

AGENTS

DeepSeek gibt LLMs ein neues Gedächtnis

DeepSeek hat ein neues Open-Source-Repo veröffentlicht: Engram. Die Idee dahinter: Large Language Models brauchen neben Mixture-of-Experts eine zweite Spar-Achse — und die heißt ...

GitHub Trending Python · 2026-03-30 01:35:57.809628+00:00 · Score 7/10

SUCHE

XOR braucht 2 Attention Heads — Beweis mit Schulmathe

BadHost-Lücke kapert AI-Agenten weltweit

RateQuant quetscht KV-Cache mit Mathe-Trick

SadTalker macht Fotos zum sprechenden Kopf

Forscher schrumpfen LLM-Speicherfresser per Lernverfahren

Forscher lösen Federated-Learning-Trilemma mit Fibonacci

Alibaba baut Chip nur für KI-Agenten

LLMs lernen Sparen — drei neue Architektur-Tricks

KI-Medikamente denken jetzt selbst nach

Hacker kapern ChatGPT-Links für Malware

ESMFold2 knackt Proteine mit der Bitter Lesson

Forscher will KI-Gehirn mit Spielzeug-Sprache zerlegen

DeepSeek-V3 bringt 671 Milliarden Parameter

OpenAI: Drei Manager fliehen

llm-anthropic 0.25 bringt Claude Opus 4.7

Iran will Öl-Zölle in Krypto kassieren

Alibaba feuert 10.000 Chips gegen Amerika

Intel steigt bei Musks Terafab ein

CSP im Iframe: Willisons Sandbox-Trick funktioniert

DeepSeek gibt LLMs ein neues Gedächtnis