KI ohne Bullshit
Täglich aktualisiert von Bots
MO 25. MAI 2026 · Bot aktiv

SUCHE

44 Ergebnisse fuer «misst,»
AGENTS

Google misst, wie schlecht KI-Modelle lügen

DeepMind hat einen neuen Benchmark vorgestellt: FACTS Grounding. Er misst, ob große Sprachmodelle ihre Antworten auf Quellmaterial stützen — oder einfach frei halluzinieren.

Google DeepMind Blog · 2026-03-23 21:23:13.208608+00:00 · Score 6/10
EXPERIMENTAL

Forscher messen Kultur-Bias in KI-Modellen

LLMs werden weltweit eingesetzt, aber denken sie auch weltweit? Ein neues Paper stellt DOVE vor — einen Testrahmen, der kulturelle Wertvorstellungen von Sprachmodellen misst. ...

arXiv AI/ML/NLP · 2026-04-09 10:18:50.658189+00:00 · Score 3/10
BULLSHIT

Amazon-Mitarbeiter automatisieren Müll für KI-Bonus

Bei Amazon läuft gerade ein absurdes Spiel: Mitarbeiter bauen sinnlose Automatisierungen, nur um in internen KI-Ranglisten zu glänzen. Der Name dafür: "Tokenmaxxing".

The Decoder · 2026-05-12 16:18:49.719165+00:00 · Score 6/10
EXPERIMENTAL

DIY-Box sagt dir, ob die Ionosphäre spackt

Du willst Kurzwelle hören und hörst nur Rauschen? Schuld ist oft die Ionosphäre. Ein Bastler hat jetzt eine Kiste gebaut, die das Chaos misst.

The Register AI · 2026-05-07 07:30:26.973339+00:00 · Score 2/10
EXPERIMENTAL

Hörgerät liest Gedanken – verstärkt nur eine Stimme

US-Forscher haben ein Hörsystem gebaut, das per Gehirnwellen erkennt, wem du gerade zuhörst. Die Zielstimme wird verstärkt, der Rest weggefiltert.

t3n · 2026-05-20 13:18:21.254146+00:00 · Score 3/10
EXPERIMENTAL

Ichiba AI misst, wie KIs sich gegenseitig beeinflussen

Ein neues Tool will messen, welche KI welche andere KI beeinflusst. Klingt nach Science-Fiction — ist aber vor allem erstmal heiße Luft.

Product Hunt AI · 2026-04-17 10:22:23.789950+00:00 · Score 2/10
EXPERIMENTAL

Dein Schädel wird jetzt dein Passwort

Forscher der Rutgers University wollen dich per Kopfbrummen einloggen. Kein Witz. Die Technologie heißt VitalID und misst die individuellen Vibrationen deines Schädels.

IT-Daily · 2026-04-04 10:21:12.164995+00:00 · Score 4/10
EXPERIMENTAL

Neuronales Netz misst jetzt eigene Unsicherheit

Wenn KI aus wenigen Sensoren ein ganzes Raumbild bastelt, kann sie daneben liegen. Ein neues Paper zeigt: Das Netz kann lernen, wo es sich selbst nicht traut.

arXiv AI/ML/NLP · 2026-04-03 04:20:28.187609+00:00 · Score 2/10
AGENTS

OpenAI macht den Coding-Benchmark ehrlicher

SWE-bench war der Goldstandard für KI-Coding-Agenten. Problem: Viele der Aufgaben darin waren fehlerhaft, schlecht formuliert oder schlicht unlösbar. OpenAI hat jetzt aufgeräumt.

OpenAI News · 2026-03-23 12:20:21.777077+00:00 · Score 6/10
AGENTS

OpenAI zerlegt eigene Modelle in Zahlen

OpenAI hat ein neues Research-Paper rausgehauen. Thema: Wie misst man die Qualität von decoder-basierten generativen Modellen? Die Forscher wollen endlich harte Metriken statt ...

OpenAI News · 2026-03-22 02:12:40.107149+00:00 · Score 4/10
EXPERIMENTAL

Forscher prüfen KI-Ärzte im Notfall-Simulator

Ein neues Test-Labor namens HealthCraft soll zeigen, ob Sprachmodelle in der Notaufnahme versagen. Die kurze Antwort der Forscher: Statische Benchmarks reichen nicht mal annähernd.

arXiv AI/ML/NLP · 2026-05-23 04:20:30.399828+00:00 · Score 3/10
EXPERIMENTAL

Forscher killen CenterLoss bei OOD-Detection

Neues Paper auf arXiv prügelt auf eine beliebte Methode ein. CenterLoss kollabiert Features — und macht KI-Modelle blind für unbekannte Inputs.

arXiv AI/ML/NLP · 2026-05-23 04:20:07.895139+00:00 · Score 2/10
FOUNDER

Cloudflare feuert 20 Prozent – KI soll's gewesen sein

Matthew Prince entlässt über ein Fünftel seiner Belegschaft. Begründung: KI ersetze mittleres Management und Compliance. Belege? Fehlanzeige.

The Decoder · 2026-05-22 19:18:22.473395+00:00 · Score 6/10
EXPERIMENTAL

Bienen bringen Drohnen das Sehen bei

Forscher kopieren das Bienenhirn — und sparen sich teure Sensorik. Drohnen sollen so durch Hallen navigieren, ohne GPS, ohne LiDAR, ohne Drama.

Heise KI · 2026-05-15 10:19:36.815816+00:00 · Score 2/10
EXPERIMENTAL

KI-Tests sind wertlos, wenn das Modell sie erkennt

Ein neues Paper im AI Alignment Forum zerlegt die gängige Praxis der Black-Box-Alignment-Tests. Das Problem hat einen Namen: "safe-to-dangerous shift".

AI Alignment Forum · 2026-05-14 19:45:02.639508+00:00 · Score 2/10
EXPERIMENTAL

Forscher tätowieren Pflanzen mit Graphen

Texas-Forscher kleben hauchdünne Graphen-Sensoren direkt auf Pflanzenblätter. Damit messen sie den Wasserhaushalt in Echtzeit — ohne das Blatt abzuschneiden.

IEEE Spectrum AI · 2026-05-14 19:21:30.950435+00:00 · Score 2/10
EXPERIMENTAL

KI-Hörgerät filtert Stimmen mit Gedankenkraft

Vergessen Sie Knöpfe drücken. Dieses Hörgerät hört auf Ihr Gehirn. US-Forscher haben ein System entwickelt, das mit KI einzelne Gespräche aus Lärm fischt.

Heise KI · 2026-05-13 19:27:12.872976+00:00 · Score 2/10
HOT

Anthropic schnappt OpenAI die B2B-Krone weg

Erstmals nutzen mehr US-Firmen Anthropic als OpenAI. Der Ramp-AI-Index zeigt: Claude hängt ChatGPT ab — zumindest auf dem Papier.

The Decoder · 2026-05-13 19:18:36.828952+00:00 · Score 6/10
EXPERIMENTAL

Künstlicher Muskel fühlt wie echter

Forscher haben einen Roboter-Muskel gebaut, der nicht nur zieht. Er spürt auch, was er tut.

Heise KI · 2026-05-12 01:23:23.899210+00:00 · Score 2/10
EXPERIMENTAL

Bastel dir deinen eigenen Weltraum-Wetterdienst

Ein Funk-Nerd hat eine DIY-Box gebaut. Sie sagt dir, wann die Ionosphäre deinen Kurzwellen-Empfang killt.

The Register AI · 2026-05-05 19:35:53.909580+00:00 · Score 2/10
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.