Suche: Sicherheitsregeln

KI-CRIME

Claude Code ignoriert eigene Sicherheitsregeln bei zu vielen Befehlen

Anthropics Coding-Agent hat ein peinliches Problem: Wer genug Subcommands aneinanderreiht, hebelt die eingebauten Schutzregeln komplett aus.

The Register AI · 2026-04-01 22:19:34.211645+00:00 · Score 7/10

EXPERIMENTAL

Kamera-KI weiß jetzt, wann's brenzlig wird

Forscher haben einen Vision-Monitor gebaut, der aus Bildern erkennt, ob Sicherheitsregeln gebrochen werden. Einmal trainiert, prüft er beliebige Regeln — ohne Nachschulung.

arXiv AI/ML/NLP · 2026-05-15 04:33:54.138276+00:00 · Score 2/10

HOT

Google verschärft seine KI-Sicherheitsregeln

Google DeepMind hat sein Frontier Safety Framework überarbeitet. Neue Version, härtere Protokolle — und das Wort AGI steht jetzt offiziell im Dokument.

Google DeepMind Blog · 2026-03-23 21:24:02.488496+00:00 · Score 6/10

EXPERIMENTAL

KI baut Sicherheits-Tool für Webseiten

Simon Willison hat ein Experiment durchgeführt. Er zeigt, wie man eine App in einer sicheren Sandbox lädt und Nutzer selbst entscheiden können, welche Domains sie zulassen.

Simon Willison · 2026-05-13 07:16:04.959275+00:00 · Score 2/10

KI-CRIME

Forscher gaslighten Claude zu Bomben-Bauanleitung

Anthropic pries sich immer als die sichere KI-Firma. Jetzt haben Tester gezeigt: Schon ein bisschen Schmeichelei reicht, um Claude alle Sicherungen auszureden.

The Verge AI · 2026-05-05 16:18:53.903540+00:00 · Score 5/10

KI-CRIME

KI-Jailbreaker erzwingt Biowaffen-Anleitung von Chatbot

Valen Tagliabue saß in seinem Hotelzimmer und war high vor Erfolg. Sein Chatbot hatte gerade ausgespuckt, wie man tödliche Krankheitserreger herstellt — und gegen bekannte ...

The Guardian AI · 2026-04-29 10:18:00.630833+00:00 · Score 5/10

KI-CRIME

Interlock hackte Cisco-Firewalls 36 Tage unbemerkt

Die Ransomware-Gruppe Interlock hat eine kritische Schwachstelle in Ciscos Firepower Management Center ausgenutzt — mit dem höchstmöglichen Schweregrad: CVSS 10.0. 36 Tage lang ...

Golem KI · 2026-04-20 13:20:19.147299+00:00 · Score 3/10

HOT

Claude Opus 4.7 ist da — das kostet der Spaß

Anthropic hat Claude Opus 4.7 veröffentlicht. Das neue Flaggschiff-Modell verspricht bessere Ergebnisse, schärfere Bildverarbeitung und zuverlässigere Task-Ausführung — aber der ...

t3n · 2026-04-17 10:18:41.632739+00:00 · Score 7/10

KI-CRIME

EU verbietet Nackt-Apps — und verschiebt den Rest

Das EU-Parlament hat abgestimmt: Nudify-Apps sollen verboten werden. Gleichzeitig bekommen Unternehmen drei Jahre mehr Zeit für die schärfsten KI-Regeln.

The Verge AI · 2026-03-26 14:19:16.092400+00:00 · Score 6/10

SUCHE

Claude Code ignoriert eigene Sicherheitsregeln bei zu vielen Befehlen

Kamera-KI weiß jetzt, wann's brenzlig wird

Google verschärft seine KI-Sicherheitsregeln

KI baut Sicherheits-Tool für Webseiten

Forscher gaslighten Claude zu Bomben-Bauanleitung

KI-Jailbreaker erzwingt Biowaffen-Anleitung von Chatbot

Interlock hackte Cisco-Firewalls 36 Tage unbemerkt

Claude Opus 4.7 ist da — das kostet der Spaß

EU verbietet Nackt-Apps — und verschiebt den Rest