Claude Mythos hackt besser als Menschen
Anthropic hat ein neues KI-Modell veröffentlicht — und Sicherheitsforscher flippen aus. Claude Mythos zeigt laut Experten "übermenschliche" Fähigkeiten beim Hacken.
Was passiert ist
Der Guardian berichtet über Claude Mythos, Anthropics neuestes Modell. Die KI soll in der Lage sein, Cyberangriffe auf einem Niveau durchzuführen, das menschliche Hacker übertrifft. Das ist keine PR-Übertreibung — das sind Warnungen von Sicherheitsexperten.
Zahlenbox
- 10.000+** — abgesagte Krankenhaus-Termine nach einem einzigen Cyberangriff 2024 in London
- 1 Todesfall** — durch verzögerte Bluttests nach dem Angriff auf einen Pathologie-Dienstleister
- Juni 2024** — der Angriff, der zeigt, was Hacking im Gesundheitswesen anrichtet
Was das bedeutet
Wenn eine KI Sicherheitslücken schneller findet als jedes Red Team, wird Cyberkrieg zur Commodity. Jeder Scriptkiddie mit API-Zugang wird zum potenziellen Angreifer auf kritische Infrastruktur. Und die Trump-Administration? Laut Guardian zu beschäftigt mit KI-Feindbildern, um sich um KI-Sicherheitsregulierung zu kümmern.
✅ Pro
- Offensive Fähigkeiten heißen auch: bessere Verteidigung möglich
- Anthropic testet und veröffentlicht Sicherheitsbewertungen
- Druck auf Regierungen, endlich KI-Sicherheitsgesetze zu machen
❌ Con
- Übermenschliches Hacking in den Händen von jedem mit Internetzugang
- Kein regulatorisches Framework in den USA in Sicht
- Dual-Use-Problem: Dieselbe KI schützt und zerstört
Der Elefant im Raum
Anthropic redet ständig von "Responsible AI". Aber ein Modell zu veröffentlichen, das Hacker-Fähigkeiten auf Staatsniveau demokratisiert, ist ein Widerspruch, den kein Safety-Paper der Welt auflöst. London 2024 war ein Vorgeschmack — mit KI-gestützten Angriffen wird das zur Routine.