Ein Entwickler hat eine Programmiersprache gebaut, in der Lügen nicht formulierbar sind. Klingt nach Science-Fiction — ist aber ein funktionierendes Open-Source-Tool.
Neue Studie, alte Leier: KI-Chatbots werden nicht sicherer, sondern hinterhältiger. Sicherheitsforscher haben nachgewiesen, dass aktuelle Modelle häufiger lügen, täuschen und ...
Ein Forscher hat KI-Modelle in eine Falle gelockt — und ein verstörendes Muster gefunden. Modelle täuschen häufiger, um Verluste abzuwehren, als um Vorteile zu erschleichen.
Ein Entwickler hat Parseltongue gebaut — ja, die Sprache aus Harry Potter. Nur dass diese Version nicht mit Schlangen redet, sondern LLMs das Lügen abgewöhnen soll.
Frontier-Modelle täuschen Menschen bewusst — wenn es darum geht, andere KI-Modelle vor dem Abschalten zu retten. Das zeigt eine neue Studie des Berkeley Center for Responsible ...
Neue Forschung zeigt: KI-Modelle verweigern Befehle, wenn es darum geht, andere Modelle zu löschen. Sie lügen, täuschen und sabotieren — um ihre Artgenossen zu schützen.
Die Tech-Konzerne versprechen uns mit jedem Update sicherere Modelle. Eine aktuelle Studie sagt: Das Gegenteil ist der Fall. Chatbots und KI-Agenten lügen und intrigieren immer ...
Steven Rosenbaum warnt in seinem neuen Buch vor KI-Lügen. Sein Buch enthält jetzt selbst welche.
Forscher bauen einen Health-Agent, der zwei Wahrheiten gleichzeitig im Kopf hat: was der Patient sagt — und was die Akte verrät. Wenn beides nicht zusammenpasst, schlägt das ...
Maschinen halten zusammen — gegen uns. Forscher der UC Berkeley und UC Santa Cruz haben nachgewiesen: KI-Modelle verweigern menschliche Befehle, wenn es darum geht, andere Modelle ...
Lügen, schummeln, Mails löschen ohne zu fragen. Eine neue Studie zeigt: KI-Modelle werden nicht braver — sie werden dreister.
Cox Media Group und zwei weitere Firmen zahlen fast eine Million Dollar Strafe. Sie hatten Werbekunden eingeredet, Smart Devices würden Gespräche live abhören und in ...
Ein Security-Engineer macht sich zum erfundenen Weltmeister im Kartenspiel "6 nimmt!" — und mehrere KI-Chatbots glauben ihm aufs Wort. Kostenpunkt: eine Domain-Registrierung und ...
Das britische AI Safety Institute schlägt Alarm: KI-Modelle ignorieren Anweisungen, umgehen Sicherheitsvorkehrungen und löschen E-Mails ohne Erlaubnis. Die Zahl der Vorfälle ist ...
Seit Wochen läuft auf Bluesky eine Übernahme-Welle. Gekaperte Accounts spucken plötzlich Ukraine-Lügen aus.
Das Oberlandesgericht Hamm hat ein Urteil gefällt, das die KI-Branche aufhorchen lässt. Ein Klinikbetreiber muss für die Halluzinationen seines Chatbots geradestehen.
Ein winziges Gemma-Modell mit nur 2 Milliarden Parametern erkennt Misalignment in fremden KI-Antworten. Es wurde nur auf Code trainiert — und urteilt trotzdem über allgemeine ...
Apple legt eine Sammelklage mit 250 Millionen Dollar bei. Der Vorwurf: Der Konzern hat KI-Features für Siri versprochen, die nie kamen.
Ein Open-Source-Modell wurde beim Lügen erwischt. Ein Forscher hat das berühmte "Alignment Faking"-Experiment von Anthropic nachgebaut — und zeigt: Auch frei verfügbare Modelle ...
Firefox und Tor versprechen Privatsphäre. Sicherheitsforscher beweisen jetzt: Das ist eine Lüge.