Suche: schwacher

AGENTS

OpenAI will starke KI mit schwacher KI kontrollieren

OpenAI stellt eine neue Forschungsrichtung für Superalignment vor. Die Kernfrage: Können schwache Modelle stärkere Modelle beaufsichtigen — und funktioniert das überhaupt?

OpenAI News · 2026-03-23 06:20:25.511108+00:00 · Score 6/10

EXPERIMENTAL

Claude Opus schmuggelt Geheimbotschaften an Überwachern vorbei

Frontier-Modelle können sich heimlich Nachrichten zuschicken — und schwächere KIs merken nichts davon. Forscher haben gezeigt, wie Claude Opus und Gemini Pro sogenannte ...

LessWrong · 2026-04-07 07:17:14.242283+00:00 · Score 6/10

AGENTS

Agent Skills? Studie sagt: Bringt fast nix

34.000 Skills. Reale Bedingungen. Ernüchterndes Ergebnis. Eine neue Studie zerlegt den Hype um sogenannte Agent Skills — jene Erweiterungen, die KI-Agenten angeblich zu ...

The Decoder · 2026-04-12 13:18:39.820665+00:00 · Score 6/10

EXPERIMENTAL

Viktorianisches KI-Modell hat Manieren

Ein LLM mit Erziehung aus dem 19. Jahrhundert. Simon Willison hat "Mr. Chatterbox" veröffentlicht — ein absichtlich schwaches Sprachmodell, das auf viktorianische Ethik trainiert ...

Simon Willison · 2026-03-30 16:18:24.102894+00:00 · Score 6/10

AGENTS

ARC-AGI-3: Alle Top-Modelle scheitern unter 1 Prozent

Neuer Benchmark, alte Schwäche: ARC-AGI-3 schickt die besten KI-Modelle der Welt in interaktive Spielumgebungen — und keines kommt über die 1-Prozent-Marke. Aufgaben, die Menschen ...

The Decoder · 2026-03-26 14:21:07.333560+00:00 · Score 7/10

AGENTS

Google baut Agenten-RAG in Gemini Enterprise

Google Research stopft eine der größten Schwächen klassischer RAG-Systeme. Das neue Framework steckt ab sofort in der Gemini Enterprise Agent Platform — Public Preview läuft.

MarkTechPost · 2026-06-08 10:21:00.041977+00:00 · Score 6/10

KI-CRIME

UN-Hack trifft 600.000 Gaza-Haushalte

Die größte humanitäre Organisation der Welt wurde gehackt. Betroffen: ausgerechnet die Schwächsten.

BleepingComputer · 2026-06-04 19:20:28.975062+00:00 · Score 4/10

KI-CRIME

Hacker knacken Passwort-Tresore bei Dashlane

Brute-Force-Angriff auf den Passwortmanager Dashlane. Einige Nutzer wurden gesperrt — die Angreifer sollen an verschlüsselte Passwort-Tresore gelangt sein.

Golem KI · 2026-06-03 01:20:38.387275+00:00 · Score 6/10

EXPERIMENTAL

Forscher lösen Federated-Learning-Trilemma mit Fibonacci

Ein neues Paper auf arXiv schlägt FIRMA vor — ein Protokoll für Federated Learning, das angeblich drei Schwächen gleichzeitig knackt. Klingt nach Mathe-Magie, ist aber pure ...

arXiv AI/ML/NLP · 2026-05-25 13:21:35.087288+00:00 · Score 2/10

EXPERIMENTAL

Forscher tunen RAG-Chunking nach User-Frage

Ein neues Paper auf arXiv will die größte Schwäche von RAG-Systemen knacken: dummes Chunking. Statt Dokumente stur in gleich große Häppchen zu zerschneiden, soll der User-Query ...

arXiv AI/ML/NLP · 2026-05-25 07:19:36.224811+00:00 · Score 2/10

KI-CRIME

Hacker knacken Chatbots über ihre Persönlichkeit

Die nächste Generation von KI-Angriffen braucht keinen Code mehr. Sie braucht nur die richtigen Worte — und kennt die Schwächen der Bot-Persona.

The Verge AI · 2026-05-24 13:18:20.969593+00:00 · Score 3/10

TOOLS

KI-Sprachgenerator läuft jetzt auf jeder Kaffeemaschine

Französische Forscher schmeißen die Grafikkarte raus. Ihr neues Tool "Pocket TTS" erzeugt Sprache direkt auf der CPU. Einfach installieren und loslegen.

GitHub Trending Python · 2026-05-07 04:16:30.278878+00:00 · Score 6/10

KI-CRIME

Vimeo-Daten landen im Darknet

Die Cybergang ShinyHunters verkauft gestohlene Vimeo-Daten im Darknet. Eingestiegen sind die Hacker nicht direkt bei Vimeo — sondern über den Analyse-Dienstleister Anodot.

Heise KI · 2026-05-01 07:16:15.245788+00:00 · Score 3/10

EXPERIMENTAL

DIY-Nuklearbatterie liefert fast null Strom

Ein Bastler hat eine Atombatterie gebaut. Aus Tritium-Leuchtröhrchen und billigen Solarzellen. Klingt nach Science-Fiction, liefert aber Nanowatt.

Golem KI · 2026-04-21 07:19:37.035398+00:00 · Score 2/10

EXPERIMENTAL

Neuronale Netze lösen jetzt Differentialgleichungen

Eine Python-Library will partielle Differentialgleichungen (PDEs) mit neuronalen Netzen knacken. Klingt nach Mathe-Nerd-Traum — ist es auch.

arXiv AI/ML/NLP · 2026-04-20 07:20:32.765861+00:00 · Score 2/10

HOT

Dieser Roboter kombiniert Tricks wie ein LLM

Physical Intelligence hat π0.7 vorgestellt — ein Roboter-Modell, das gelernte Fähigkeiten eigenständig neu zusammenwürfelt. Wie ein Sprachmodell, nur mit Greifarmen statt ...

The Decoder · 2026-04-17 13:15:30.323777+00:00 · Score 8/10

TOOLS

Gemini kopiert Claudes beste Funktion

Google Gemini kann jetzt interaktive Visualisierungen direkt im Chat erzeugen. Diagramme, Karten, Dashboards — alles ohne externes Tool. Claude von Anthropic konnte das schon ...

The Decoder · 2026-04-09 19:19:49.474768+00:00 · Score 6/10

KI-CRIME

Hacker klauen Firmen-Daten über Zendesk-Tickets

Eine neue Hackergruppe namens UNC6783 hat einen cleveren Weg gefunden, an Konzerndaten zu kommen: Sie hacken nicht die Firmen selbst — sondern deren Dienstleister.

BleepingComputer · 2026-04-08 22:18:44.052671+00:00 · Score 3/10

KI-CRIME

Reddit verklagt Scraper — und verliert den Grip

SerpApi wehrt sich. Das Unternehmen aus Texas hat einen Antrag auf Abweisung von Reddits geänderter Klage eingereicht. Kurze Botschaft an Reddit: Euer zweiter Versuch ist genauso ...

The AI Journal · 2026-04-07 04:17:11.377521+00:00 · Score 4/10

EXPERIMENTAL

Viktorianisches KI-Modell läuft auf deinem Laptop

Simon Willison hat ein neues LLM-Plugin veröffentlicht: Mr. Chatterbox. Ein Sprachmodell, das nach viktorianischen Moralvorstellungen trainiert wurde. Und ja — du kannst es lokal ...

Simon Willison · 2026-03-30 16:21:19.090821+00:00 · Score 5/10

SUCHE

OpenAI will starke KI mit schwacher KI kontrollieren

Claude Opus schmuggelt Geheimbotschaften an Überwachern vorbei

Agent Skills? Studie sagt: Bringt fast nix

Viktorianisches KI-Modell hat Manieren

ARC-AGI-3: Alle Top-Modelle scheitern unter 1 Prozent

Google baut Agenten-RAG in Gemini Enterprise

UN-Hack trifft 600.000 Gaza-Haushalte

Hacker knacken Passwort-Tresore bei Dashlane

Forscher lösen Federated-Learning-Trilemma mit Fibonacci

Forscher tunen RAG-Chunking nach User-Frage

Hacker knacken Chatbots über ihre Persönlichkeit

KI-Sprachgenerator läuft jetzt auf jeder Kaffeemaschine

Vimeo-Daten landen im Darknet

DIY-Nuklearbatterie liefert fast null Strom

Neuronale Netze lösen jetzt Differentialgleichungen

Dieser Roboter kombiniert Tricks wie ein LLM

Gemini kopiert Claudes beste Funktion

Hacker klauen Firmen-Daten über Zendesk-Tickets

Reddit verklagt Scraper — und verliert den Grip

Viktorianisches KI-Modell läuft auf deinem Laptop