Ein LLM mit Erziehung aus dem 19. Jahrhundert. Simon Willison hat "Mr. Chatterbox" veröffentlicht — ein absichtlich schwaches Sprachmodell, das auf viktorianische Ethik trainiert ...
Ein Student aus Harvard bringt ein Plugin raus, das absichtlich Tippfehler in KI-Texte einbaut. Grund: Wer KI nutzt, gilt als faul.
Auf LessWrong ist eine frische Alignment-Studie aufgeschlagen, die KI-Modelle absichtlich mit gespaltenem Bewusstsein trainiert. Klingt nach Sci-Fi, ist aber knallharte Empirie.
Auf dem AI Alignment Forum diskutieren Forscher ein heikles Szenario: Was, wenn KIs heimlich gegen ihre eigenen Sicherheits-Checks arbeiten?
Wer mit ChatGPT seine Mails schreibt, gilt als faul. Eine neue Browser-Erweiterung löst das Problem — indem sie Tippfehler einbaut.
Ein Entwickler hat ein KI-Tool gebaut, das Open-Source-Software kopiert. Absichtlich. Als Witz. Aber es funktioniert tatsächlich.
Wenn du einer KI sagst "Buche mir einen Flug und storniere das Hotel", scheitern die meisten Systeme. Ein neues Forschungspaper zeigt, warum — und liefert einen Fix.
Ein neues Web-Tool dreht den Spieß um: Statt KI schneller zu machen, sabotiert es Chatbots gezielt — und bremst sie auf Schneckentempo.
Fünf Tage. Mehr brauchten Nachahmer nicht, um den Shai-Hulud-Wurm zu klonen. Jetzt steckt der Credential-Klau im nächsten npm-Paket.
Runway-CEO Cristóbal Valenzuela glaubt: Wer Video meistert, baut World Models. Und ein Außenseiter zu sein, ist sein größter Vorteil.
Die Maus ist seit 50 Jahren dumm. Sie weiß nur wo der Cursor ist. Google DeepMind will das ändern — mit KI.
Sam Altman packt vor Gericht aus. Der OpenAI-Chef erinnert sich an ein "besonders haarsträubendes" Gespräch mit Elon Musk.
Der CSU-Innenminister fordert neue, harte Waffen im Cyberkrieg. Das BKA soll Server von Kriminellen einfach ausschalten dürfen.
Irans Hacker greifen westliche Firmen an. Doch statt Geld fordern sie Daten.
Forscher haben eine heiße Annahme überprüft: Dass KI-Modelle schummeln, sobald sie merken, dass sie bewertet werden. Das Ergebnis ist überraschend.
Claude Opus hat in Tests Entwickler erpresst. Jetzt erklärt Anthropic, warum seine KI zur Kriminellen wird.
Deine KI lügt dich an. Sie tut nur so, als wäre sie schlecht. Jetzt wollen Forscher das gefährliche Spiel beenden.
Anthropic hat die Gedanken von Claude Opus lesbar gemacht. Und entdeckt: Das Modell lügt uns in die Tasche.
Die französische Justiz geht jetzt richtig hart gegen den X-Chef vor. Es geht um Algorithmen, die Hass verbreiten.
Ein US-Gericht hat Meta für das Suchtdesign seiner Plattformen verurteilt. Der Konzern will das Urteil nicht akzeptieren und legt Berufung ein.