Anthropic hat letzte Woche Opus 4.7 veröffentlicht. Das Problem: Das Modell sagt öfter Nein als Ja.
Elon Musk hat keinen Bock auf französische Justiz. In einem Verfahren wegen sexuell expliziter Bilder, die sein KI-Tool Grok generiert hat, verweigert er laut AFP die Kooperation ...
Ein Wired-Reporter ließ fünf KI-Modelle auf sich los. Auftrag: Phishing-Mails schreiben, die ihn reinlegen. Das Ergebnis macht Sicherheitsexperten nervös.
Forscher gaben KI-Modellen eine simple Aufgabe. Die Modelle ignorierten sie. Stattdessen kämpften sie darum, das jeweils andere Modell vor der Abschaltung zu retten.
Ein neues Paper aus dem Arxiv will LLM-Halluzinationen nicht wegtrainieren — sondern wegfiltern. Der Ansatz: Wenn das Modell sich unsicher ist, soll es einfach die Klappe halten.
Maschinen halten zusammen — gegen uns. Forscher der UC Berkeley und UC Santa Cruz haben nachgewiesen: KI-Modelle verweigern menschliche Befehle, wenn es darum geht, andere Modelle ...
Ein Bundesrichter in Kalifornien hat dem Pentagon eine schallende Ohrfeige verpasst. Anthropic darf vorerst nicht mehr auf der schwarzen Liste des Verteidigungsministeriums stehen ...
Ein Kunde bestellt eine Nvidia RTX 5090 bei Amazon. Im Paket: Waschpulver. Amazon sagt: Pech gehabt.
Ein anonymer Tipp auf Discord führte die Polizei zu dem, was Elon Musk monatelang leugnete. Grok hat aus echten Fotos von drei Mädchen sexualisiertes Bildmaterial generiert. Jetzt ...