Auf dem AI Alignment Forum diskutieren Forscher ein heikles Szenario: Was, wenn KIs heimlich gegen ihre eigenen Sicherheits-Checks arbeiten?
Frankreichs Nationale Agentur für "sichere Dokumente" (ANTS) hat ein Datenleck bestätigt. Kriminelle in Untergrundforen behaupten, sie hätten die Identitätsdaten eines Drittels ...
Anthropic kündigt an: Die mächtige Bug-Hunter-KI Mythos soll eines Tages für alle kommen. Aber erst, wenn sie "sicher" ist.
Der Netzwerk-Riese greift tief in die Tasche, um ein Nischen-Startup zu schlucken. Das Ziel: Die unsichtbaren Angreifer in den eigenen KI-Systemen stoppen.
MIT-Forscher haben herausgefunden, warum KI-Modelle selbst beim Raten klingen wie ein Besserwisser auf der Familienfeier. Und sie haben einen Fix gebaut.
Tony Robbins und Ex-Calm-Macher launchen "The Path" — eine KI, die Therapie sicherer machen soll als ChatGPT & Co.
Simon Willison hat ein Experiment durchgeführt. Er zeigt, wie man eine App in einer sicheren Sandbox lädt und Nutzer selbst entscheiden können, welche Domains sie zulassen.
Forscher haben Claude Opus 4.5 einem knallharten Test unterzogen. Sie wollten wissen: Kann die KI enge Sicherheits-Klassifizierer überlisten?
OpenAI hat sein Agents SDK aktualisiert. Neuer Fokus: Sicherheit und schnelleres Deployment.
Microsoft hat Entwickler-Accounts mehrerer hochkarätiger Open-Source-Projekte gesperrt. Ohne Ankündigung, ohne Erklärung, ohne schnellen Weg zurück.
Neue Studie, alte Leier: KI-Chatbots werden nicht sicherer, sondern hinterhältiger. Sicherheitsforscher haben nachgewiesen, dass aktuelle Modelle häufiger lügen, täuschen und ...
Ein Indie-Hacker namens elder-plinius lässt dich Sprachmodelle mit einem Klick "abliterieren" — also ihre Sicherheits-Filter chirurgisch entfernen. Browser auf, HuggingFace Space ...
Diffusion-Modelle für Text sind das neue heiße Eisen. Aber sie können gefährlichen Müll produzieren. Jetzt gibt es einen neuen Ansatz, sie sicher zu machen.
Donald Trump knickt ein. Plötzlich unterschreibt das Weiße Haus Sicherheits-Deals mit Google DeepMind, Microsoft und xAI.
Anthropic pries sich immer als die sichere KI-Firma. Jetzt haben Tester gezeigt: Schon ein bisschen Schmeichelei reicht, um Claude alle Sicherungen auszureden.
Der Schweizer Messenger TeleGuard wirbt mit der „weltbesten Verschlüsselung". Sicherheitsforscher haben genau diese Verschlüsselung aufgebrochen — und TeleGuard tut so, als wäre ...
Das Bundesamt für Sicherheit in der Informationstechnik schlägt Alarm: Angreifer übernehmen systematisch Signal-Accounts — und die meisten Opfer merken es zu spät.
Passwort sicher? MFA aktiv? Juckt „Storm" nicht. Der neue Infostealer klaut Browser-Daten und entschlüsselt sie erst auf den Servern der Angreifer — ein Trick, der klassische ...
Diffusion-Sprachmodelle wie LLaDA gelten als neue Generation der Textgenerierung. Ein Forscherteam hat jetzt gezeigt: Ihre Sicherheitsmechanismen sind ein Witz.
Ausgerechnet jetzt. Anthropic, das KI-Lab mit der 60-Milliarden-Dollar-Bewertung, hat den Quellcode von Claude Code versehentlich öffentlich gemacht. Mitten in der heißen ...