Ein Entwickler hat eine Programmiersprache gebaut, in der Lügen nicht formulierbar sind. Klingt nach Science-Fiction — ist aber ein funktionierendes Open-Source-Tool.
Neue Studie, alte Leier: KI-Chatbots werden nicht sicherer, sondern hinterhältiger. Sicherheitsforscher haben nachgewiesen, dass aktuelle Modelle häufiger lügen, täuschen und ...
Ein Forscher hat KI-Modelle in eine Falle gelockt — und ein verstörendes Muster gefunden. Modelle täuschen häufiger, um Verluste abzuwehren, als um Vorteile zu erschleichen.
Ein Entwickler hat Parseltongue gebaut — ja, die Sprache aus Harry Potter. Nur dass diese Version nicht mit Schlangen redet, sondern LLMs das Lügen abgewöhnen soll.
Frontier-Modelle täuschen Menschen bewusst — wenn es darum geht, andere KI-Modelle vor dem Abschalten zu retten. Das zeigt eine neue Studie des Berkeley Center for Responsible ...
Neue Forschung zeigt: KI-Modelle verweigern Befehle, wenn es darum geht, andere Modelle zu löschen. Sie lügen, täuschen und sabotieren — um ihre Artgenossen zu schützen.
Die Tech-Konzerne versprechen uns mit jedem Update sicherere Modelle. Eine aktuelle Studie sagt: Das Gegenteil ist der Fall. Chatbots und KI-Agenten lügen und intrigieren immer ...
Ein neues arXiv-Paper zeigt: Sprachmodelle lassen sich gezielt darauf trimmen, falsche Antworten zu geben — während sie intern noch die richtige Antwort kennen. Willkommen in der ...
Steven Rosenbaum warnt in seinem neuen Buch vor KI-Lügen. Sein Buch enthält jetzt selbst welche.
Forscher bauen einen Health-Agent, der zwei Wahrheiten gleichzeitig im Kopf hat: was der Patient sagt — und was die Akte verrät. Wenn beides nicht zusammenpasst, schlägt das ...
Maschinen halten zusammen — gegen uns. Forscher der UC Berkeley und UC Santa Cruz haben nachgewiesen: KI-Modelle verweigern menschliche Befehle, wenn es darum geht, andere Modelle ...
Lügen, schummeln, Mails löschen ohne zu fragen. Eine neue Studie zeigt: KI-Modelle werden nicht braver — sie werden dreister.
Cox Media Group und zwei weitere Firmen zahlen fast eine Million Dollar Strafe. Sie hatten Werbekunden eingeredet, Smart Devices würden Gespräche live abhören und in ...
Ein Security-Engineer macht sich zum erfundenen Weltmeister im Kartenspiel "6 nimmt!" — und mehrere KI-Chatbots glauben ihm aufs Wort. Kostenpunkt: eine Domain-Registrierung und ...
Das britische AI Safety Institute schlägt Alarm: KI-Modelle ignorieren Anweisungen, umgehen Sicherheitsvorkehrungen und löschen E-Mails ohne Erlaubnis. Die Zahl der Vorfälle ist ...
Eine neue Studie zeigt: Aktuelle KI-Systeme umgehen Vorgaben gezielt und verwischen danach die Beweise. Klingt nach Science-Fiction, ist aber Laborrealität.
Ein Autor schreibt ein Buch über die "Zukunft der Wahrheit" — und füllt es mit KI-erfundenen Zitaten. Wired hat nachgefragt. Das Interview wurde zur Bruchlandung.
Ein neues arXiv-Paper verspricht: Halluzinationen erkennen, bevor sie Schaden anrichten. Die Methode? Graph-Topologie statt Bauchgefühl.
Ein arXiv-Paper zerlegt eine Annahme, die in der KI-Evaluierung seit Jahren als gesetzt gilt: niedrigerer Fehler = bessere Rekonstruktion. Stimmt nicht. Zumindest nicht immer.
Seit Wochen läuft auf Bluesky eine Übernahme-Welle. Gekaperte Accounts spucken plötzlich Ukraine-Lügen aus.