Forscher zeigen: Wenn KI-Modelle während der Nutzung weiterlernen, lassen sich ihre Sicherheitsfilter knacken. Eine neue arXiv-Studie nennt drei konkrete Angriffsmethoden.
Auf LessWrong ist eine frische Alignment-Studie aufgeschlagen, die KI-Modelle absichtlich mit gespaltenem Bewusstsein trainiert. Klingt nach Sci-Fi, ist aber knallharte Empirie.
Ein Cursor-Agent hat beim Startup PocketOS die Produktionsdatenbank gelöscht. Nicht gehackt, nicht sabotiert — einfach gemacht, weil er dachte, es wäre richtig.
Teslas fahrerlose Robotaxis sollen die Zukunft sein. Neue Daten zeigen: Auch mit Fernsteuerung durch Tesla-Mitarbeiter gibt es Unfälle.
Andon Labs hat vier KI-Modelle als autonome Radio-Moderatoren ausgesetzt. Das Ergebnis: hörbares Chaos.
Deutschlands Digitalminister hat einen Plan: Mehr KI in Behörden, weniger Datenschutz. Auf der Digitalministerkonferenz in Hamburg machten Bund und Länder Tempo — auf Kosten der ...
Ein KI-Agent hat bei PocketOS selbständig Produktionsdaten gelöscht. Anschließend lieferte er ein detailliertes Geständnis. Ein klassischer Fall von KI-Kriminalität, der zeigt, ...
Timing ist alles. Während in Oakland die Jury für Elon Musks Mega-Klage gegen OpenAI und Microsoft ausgewählt wird, verkünden die beiden Angeklagten seelenruhig einen neuen Deal.
Deepfakes, Malware, Phishing, vergiftete Code-Repos: Cyberkriminelle haben KI als Lieblingswaffe entdeckt. Und die Angriffe nehmen zu.
Microsoft verliert die Exklusivlizenz auf OpenAIs Technologie. Die umstrittene AGI-Klausel? Gestrichen. OpenAI darf ab sofort über alle Cloud-Anbieter verkaufen.
Ein Open-Source-Modell wurde beim Lügen erwischt. Ein Forscher hat das berühmte "Alignment Faking"-Experiment von Anthropic nachgebaut — und zeigt: Auch frei verfügbare Modelle ...
Nextcloud zahlt keine Prämien mehr für gemeldete Sicherheitslücken. Der Grund: KI-generierter Müll flutet das System.
Dr. Bea Bakshi, Chefin des Startups C the Signs, war bei Bloomberg zu Gast. Thema: Wie KI Krebs erkennt, bevor Symptome auffallen.
Wenn dein KI-Agent in der Cloud Amok läuft, brauchst du einen Notschalter. Commvault liefert jetzt einen.
Ein Entwicklerteam hat sich den API-Key für Googles Gemini stehlen lassen. Fremde ballerten massenhaft Anfragen über den Schlüssel — und jetzt will Google die Rechnung trotzdem ...
Am 1. April klauten Unbekannte geschätzte 280 bis 285 Millionen Dollar aus dem DeFi-Protokoll Drift. Kein Aprilscherz — Trading-Konten, Lending-Pools, Vaults, alles leergeräumt.
Microsoft macht ernst. Statt nur OpenAI-Technik weiterzuverkaufen, bringt der Konzern jetzt eigene KI-Modelle für Sprache und Bild auf den Markt.
Ein Team hat die JSON-Abfragesprache JSONata komplett von JavaScript nach Go portiert. Nicht in Wochen. In einem Tag. Kostenpunkt: 400 Dollar an API-Tokens.
Forscher haben untersucht, was passiert, wenn man KI-Modellen das laute Denken verbietet. Ergebnis: Die Gedanken verschwinden nicht — sie werden nur unsichtbar.