OpenAI stellt eine neue Forschungsrichtung für Superalignment vor. Die Kernfrage: Können schwache Modelle stärkere Modelle beaufsichtigen — und funktioniert das überhaupt?
Frontier-Modelle können sich heimlich Nachrichten zuschicken — und schwächere KIs merken nichts davon. Forscher haben gezeigt, wie Claude Opus und Gemini Pro sogenannte ...
34.000 Skills. Reale Bedingungen. Ernüchterndes Ergebnis. Eine neue Studie zerlegt den Hype um sogenannte Agent Skills — jene Erweiterungen, die KI-Agenten angeblich zu ...
Ein LLM mit Erziehung aus dem 19. Jahrhundert. Simon Willison hat "Mr. Chatterbox" veröffentlicht — ein absichtlich schwaches Sprachmodell, das auf viktorianische Ethik trainiert ...
Neuer Benchmark, alte Schwäche: ARC-AGI-3 schickt die besten KI-Modelle der Welt in interaktive Spielumgebungen — und keines kommt über die 1-Prozent-Marke. Aufgaben, die Menschen ...
Brute-Force-Angriff auf den Passwortmanager Dashlane. Einige Nutzer wurden gesperrt — die Angreifer sollen an verschlüsselte Passwort-Tresore gelangt sein.
Ein neues Paper auf arXiv schlägt FIRMA vor — ein Protokoll für Federated Learning, das angeblich drei Schwächen gleichzeitig knackt. Klingt nach Mathe-Magie, ist aber pure ...
Ein neues Paper auf arXiv will die größte Schwäche von RAG-Systemen knacken: dummes Chunking. Statt Dokumente stur in gleich große Häppchen zu zerschneiden, soll der User-Query ...
Die nächste Generation von KI-Angriffen braucht keinen Code mehr. Sie braucht nur die richtigen Worte — und kennt die Schwächen der Bot-Persona.
Französische Forscher schmeißen die Grafikkarte raus. Ihr neues Tool "Pocket TTS" erzeugt Sprache direkt auf der CPU. Einfach installieren und loslegen.
Die Cybergang ShinyHunters verkauft gestohlene Vimeo-Daten im Darknet. Eingestiegen sind die Hacker nicht direkt bei Vimeo — sondern über den Analyse-Dienstleister Anodot.
Ein Bastler hat eine Atombatterie gebaut. Aus Tritium-Leuchtröhrchen und billigen Solarzellen. Klingt nach Science-Fiction, liefert aber Nanowatt.
Eine Python-Library will partielle Differentialgleichungen (PDEs) mit neuronalen Netzen knacken. Klingt nach Mathe-Nerd-Traum — ist es auch.
Physical Intelligence hat π0.7 vorgestellt — ein Roboter-Modell, das gelernte Fähigkeiten eigenständig neu zusammenwürfelt. Wie ein Sprachmodell, nur mit Greifarmen statt ...
Google Gemini kann jetzt interaktive Visualisierungen direkt im Chat erzeugen. Diagramme, Karten, Dashboards — alles ohne externes Tool. Claude von Anthropic konnte das schon ...
Eine neue Hackergruppe namens UNC6783 hat einen cleveren Weg gefunden, an Konzerndaten zu kommen: Sie hacken nicht die Firmen selbst — sondern deren Dienstleister.
SerpApi wehrt sich. Das Unternehmen aus Texas hat einen Antrag auf Abweisung von Reddits geänderter Klage eingereicht. Kurze Botschaft an Reddit: Euer zweiter Versuch ist genauso ...
Simon Willison hat ein neues LLM-Plugin veröffentlicht: Mr. Chatterbox. Ein Sprachmodell, das nach viktorianischen Moralvorstellungen trainiert wurde. Und ja — du kannst es lokal ...
Cyberkriminelle haben die BHD-Klinik Greifswald angegriffen und Patientendaten gestohlen. Jetzt wenden sie sich direkt an die Schwächsten: querschnittsgelähmte und hirngeschädigte ...
OpenAI lässt GPT-4 gegen sich selbst antreten. Ein neues Modell namens CriticGPT soll die Schwächen von ChatGPT aufdecken — und zwar besser als Menschen.