Ein neues Gadget sieht aus wie eine Kamera. Doch statt Fotos schießt es schlechte Poesie. Wir haben den Poetry Camera getestet.
Dein Chatbot gibt dir immer Recht. Klingt nett — ist aber ein Problem, sagt jetzt eine Studie im Fachjournal Science.
DeepMind hat einen neuen Benchmark vorgestellt: FACTS Grounding. Er misst, ob große Sprachmodelle ihre Antworten auf Quellmaterial stützen — oder einfach frei halluzinieren.
SWE-bench war der Goldstandard für KI-Coding-Agenten. Problem: Viele der Aufgaben darin waren fehlerhaft, schlecht formuliert oder schlicht unlösbar. OpenAI hat jetzt aufgeräumt.
Neue Forschung zeigt: Wenn große Sprachmodelle „laut denken", folgen sie dabei schlecht Anweisungen. Ihre Antworten? Die lassen sich problemlos steuern. Ihr Denkprozess? Nicht so ...
Anthropic schiebt das neue Spitzenmodell raus. Coding-Skills hoch, Cyber-Skills runter — ganz bewusst.
Die UN-Cybercrime-Konvention kommt — und Berlin nickt einfach durch. Trotz massiver Kritik von Bürgerrechtlern, Datenschützern und der Tech-Branche.
Neue Schadsoftware im Umlauf: „LucidRook" zielt gezielt auf Nichtregierungsorganisationen und Universitäten in Taiwan. Die Angreifer setzen auf klassisches Spear-Phishing — ...
Klingt wie ein schlechter Witz, ist aber real: Cyberkriminelle haben knapp 100 Online-Shops auf Magento-Basis infiziert — mit einem Schadcode, der sich in einem einzigen Pixel ...
Monatelang lachte die Open-Source-Szene über schlecht zusammengeschusterte KI-Reports. Damit ist Schluss.
Forscher haben ein Problem mit LLM-Benchmarks: Die Bewertungsmaßstäbe selbst sind oft Müll. RIFT liefert jetzt eine Taxonomie, die zeigt, wo genau Rubrics versagen.
Ex-Facebook-Mitarbeiter weiß, wie Content Moderation funktioniert — und wie schlecht. Jetzt will er das Problem mit KI lösen. Moonbounce hat 12 Millionen Dollar eingesammelt.
Künstliche Intelligenz sagt dir, was du hören willst. Und das macht dich zum Arschloch — sagen jetzt Forscher.
Eine Gruppe namens TeamPCP greift gezielt Kubernetes-Cluster an. Ihr Werkzeug: Ein Wiper-Skript, das alle Maschinen plattmacht — aber nur, wenn sie auf den Iran konfiguriert sind.
OpenAI hat Accounts gesperrt, die zu einer verdeckten iranischen Einflussoperation gehörten. Die Konten nutzten ChatGPT, um massenhaft Inhalte für Websites und Social Media zu ...
Google hat A2UI 0.9 veröffentlicht — einen Standard, mit dem KI-Agenten dynamisch Benutzeroberflächen erzeugen können. Framework-unabhängig, mit eigenem Agent-SDK.
Forscher zwingen KI-Modelle, ihre Gedankengänge zu verstecken. Es funktioniert nicht. Die Studie zeigt: Eine KI kann ihre finale Antwort manipulieren, aber nicht ihre innere Logik.
Die kirgisische Krypto-Börse Grinex ist 13,7 Millionen Dollar los. Statt Fehler einzugestehen, zeigt die Firma mit dem Finger auf „westliche Geheimdienste".
Gestohlene Kreditkarten kauft man nicht einfach blind. Im Darknet gibt es Anleitungen, die Betrügern beibringen, welche Shops vertrauenswürdig sind — und welche sie abzocken.
Anthropic hat ein neues KI-Modell namens Mythos. Und das US-Militär nutzt KI bereits aktiv im Iran-Konflikt — für die Intensivierung von Luftschlägen.