Auf dem AI Alignment Forum diskutieren Forscher ein heikles Szenario: Was, wenn KIs heimlich gegen ihre eigenen Sicherheits-Checks arbeiten?
Das US-Handelsministerium dreht den Sicherheits-Check auf. Google DeepMind, Microsoft und xAI müssen ihre Modelle jetzt vor dem Launch prüfen lassen.
Die Forscher haben einen Weg gefunden, die geheimen Zahlen im Kopf von Claude in normale Sprache zu übersetzen.
Ein KI-Agent von Anthropic hat den Firefox-Browser zerlegt. Das Ergebnis: 271 bisher unentdeckte Sicherheitslücken.