OpenAI stellt eine neue Forschungsrichtung für Superalignment vor. Die Kernfrage: Können schwache Modelle stärkere Modelle beaufsichtigen — und funktioniert das überhaupt?
Frontier-Modelle können sich heimlich Nachrichten zuschicken — und schwächere KIs merken nichts davon. Forscher haben gezeigt, wie Claude Opus und Gemini Pro sogenannte ...
34.000 Skills. Reale Bedingungen. Ernüchterndes Ergebnis. Eine neue Studie zerlegt den Hype um sogenannte Agent Skills — jene Erweiterungen, die KI-Agenten angeblich zu ...
Ein LLM mit Erziehung aus dem 19. Jahrhundert. Simon Willison hat "Mr. Chatterbox" veröffentlicht — ein absichtlich schwaches Sprachmodell, das auf viktorianische Ethik trainiert ...
Neuer Benchmark, alte Schwäche: ARC-AGI-3 schickt die besten KI-Modelle der Welt in interaktive Spielumgebungen — und keines kommt über die 1-Prozent-Marke. Aufgaben, die Menschen ...
Physical Intelligence hat π0.7 vorgestellt — ein Roboter-Modell, das gelernte Fähigkeiten eigenständig neu zusammenwürfelt. Wie ein Sprachmodell, nur mit Greifarmen statt ...
Google Gemini kann jetzt interaktive Visualisierungen direkt im Chat erzeugen. Diagramme, Karten, Dashboards — alles ohne externes Tool. Claude von Anthropic konnte das schon ...
Eine neue Hackergruppe namens UNC6783 hat einen cleveren Weg gefunden, an Konzerndaten zu kommen: Sie hacken nicht die Firmen selbst — sondern deren Dienstleister.
SerpApi wehrt sich. Das Unternehmen aus Texas hat einen Antrag auf Abweisung von Reddits geänderter Klage eingereicht. Kurze Botschaft an Reddit: Euer zweiter Versuch ist genauso ...
Simon Willison hat ein neues LLM-Plugin veröffentlicht: Mr. Chatterbox. Ein Sprachmodell, das nach viktorianischen Moralvorstellungen trainiert wurde. Und ja — du kannst es lokal ...
Cyberkriminelle haben die BHD-Klinik Greifswald angegriffen und Patientendaten gestohlen. Jetzt wenden sie sich direkt an die Schwächsten: querschnittsgelähmte und hirngeschädigte ...
OpenAI lässt GPT-4 gegen sich selbst antreten. Ein neues Modell namens CriticGPT soll die Schwächen von ChatGPT aufdecken — und zwar besser als Menschen.
14 führende KI-Modelle sollten komplexe Visualisierungen aus realen Datensätzen erzeugen. Das Ergebnis: selbst die Besten verlieren fast die Hälfte ihrer Leistung.
Forscher haben einem Latent-Reasoning-Modell ins Gehirn geschaut. Mit PCA und Logit Lens zeigt sich: Die erste Hauptkomponente der Hidden States korreliert stark mit dem Ende der ...
Sequoia Capital hat einen neuen Expansion Fund über 7 Milliarden Dollar aufgelegt. Das Ziel: Noch mehr Geld in KI-Giganten wie OpenAI und Anthropic pumpen.
Anthropic hat Claude Opus 4.7 freigegeben. Das Modell soll Anweisungen "substanziell besser" befolgen als der Vorgänger.
Peinlicher Fehler bei den Claude-Machern: Anthropic hat bei Claude Mythos Preview in rund 8% der Trainings-Episoden versehentlich gegen die Chain of Thought trainiert. Das heißt: ...
Europas größte Fitnesskette hat ein massives Datenleck. Ein Angreifer hat sich Zugang zur IT-Infrastruktur von Basic-Fit verschafft und persönliche Daten von über einer Million ...
Die ShinyHunters-Gang hat ernst gemacht. Nach einem Einbruch beim Analytics-Anbieter Anodot sind interne Daten von Rockstar Games im Netz gelandet.
John Giannandrea räumt seinen Posten bei Apple. Der Mann, der Apples KI-Strategie verantwortete, verlässt den Konzern — nach einem der peinlichsten Produktstarts der jüngeren ...