Suche: Metrik

EXPERIMENTAL

Neue Metrik soll Daten-Mix endlich entzaubern

Forscher stellen RADAR vor — eine Metrik, die vorhersagen soll, ob extra Trainingsdaten dein Modell besser oder schlechter machen.

arXiv AI/ML/NLP · 2026-05-26 01:18:19.721604+00:00 · Score 2/10

EXPERIMENTAL

Neue Metrik entlarvt KI-Drogenjäger als Bluffer

Forscher haben eine Methode entwickelt, die zeigt, wann Machine-Learning-Modelle in der Wirkstoffsuche raten statt verstehen. Veröffentlicht in Nature Machine Intelligence, 9. ...

Nature Mach Intel · 2026-06-10 04:21:40.519545+00:00 · Score 3/10

EXPERIMENTAL

8 Zahlen für die Psyche reichen nicht

Ein Typ trackt seinen Kopf mit Sprachbefehlen und KI. Morgens und abends sagt er "Hey Exo" ins Handy, labert über seinen Tag, seine Stimmung, seinen Schlaf — und ein LLM sortiert ...

LessWrong · 2026-04-04 01:19:22.360286+00:00 · Score 2/10

AGENTS

MLPerf v6.0: Alle feiern Rekorde, keiner gewinnt

Nvidia, AMD und Intel haben ihre neuesten Benchmark-Ergebnisse für MLPerf Inference v6.0 vorgelegt. Jeder Hersteller feiert sich selbst — doch wer wirklich vorne liegt, weiß ...

The Decoder · 2026-04-03 09:20:26.912053+00:00 · Score 6/10

EXPERIMENTAL

Pointwise-Metriken lügen — neue Studie räumt auf

Ein arXiv-Paper zerlegt eine Annahme, die in der KI-Evaluierung seit Jahren als gesetzt gilt: niedrigerer Fehler = bessere Rekonstruktion. Stimmt nicht. Zumindest nicht immer.

arXiv AI/ML/NLP · 2026-05-25 13:20:54.038768+00:00 · Score 2/10

BULLSHIT

Amazon killt KI-Leaderboard nach Massen-Betrug

Amazon hat heimlich seine interne KI-Bestenliste abgeschaltet. Offiziell, weil das Ziel erreicht sei. Inoffiziell, weil Mitarbeiter das System nach Strich und Faden ausgenutzt ...

404 Media · 2026-06-01 19:21:54.407408+00:00 · Score 6/10

EXPERIMENTAL

Apple lehrt KI bessere Bildbeschreibungen

Apple ML Research veröffentlicht ein neues Framework namens BalCapRL. Es soll Bildunterschriften von Multimodal-LLMs ausgewogener machen.

Apple ML Research · 2026-05-12 01:21:03.843305+00:00 · Score 3/10

FOUNDER

Meta belohnt, wer am meisten KI verschwendet

Bei Meta gibt es jetzt eine interne Rangliste für KI-Token-Verbrauch. Wer am meisten raushaut, bekommt Titel. Nicht wer am besten arbeitet — wer am meisten verbraucht.

The Decoder · 2026-04-07 10:15:46.295457+00:00 · Score 6/10

AGENTS

OpenAI zerlegt eigene Modelle in Zahlen

OpenAI hat ein neues Research-Paper rausgehauen. Thema: Wie misst man die Qualität von decoder-basierten generativen Modellen? Die Forscher wollen endlich harte Metriken statt ...

OpenAI News · 2026-03-22 02:12:40.107149+00:00 · Score 4/10

EXPERIMENTAL

KI baut sich selbst um — 502% Boost

Ein neues Framework lässt KI-Agenten ihre eigene Architektur und Gewichte autonom verbessern. Das Paper liefert Zahlen, bei denen man zweimal hinschauen muss.

GitHub Trending Python · 2026-06-12 07:20:06.767382+00:00 · Score 6/10

EXPERIMENTAL

Forscher jagen KI-Halluzinationen in Echtzeit

Ein neues arXiv-Paper will den Moment erwischen, in dem ein Sprachmodell vom Faktencheck in den Fiebertraum kippt. Statt nur zu klassifizieren, soll ein Live-Monitor Alarm ...

arXiv AI/ML/NLP · 2026-06-12 04:21:00.643577+00:00 · Score 2/10

EXPERIMENTAL

Sinclair will Menschen 10 Jahre jünger machen

Longevity-Star David Sinclair geht aufs Ganze. Der Harvard-Forscher startet Humantests für eine "Reprogramming"-Pille — im Rahmen eines 101-Millionen-Dollar-Wettbewerbs der XPrize ...

MIT Technology Review · 2026-06-10 04:20:23.607857+00:00 · Score 2/10

GELD

Coralogix kassiert 200 Millionen für Agenten-Aufpasser

Wer überwacht eigentlich die KI-Agenten, die jetzt überall durch die Systeme rauschen? Coralogix sagt: Wir. Und holt sich dafür frisches Geld.

TechCrunch AI · 2026-06-03 16:19:52.607204+00:00 · Score 7/10

EXPERIMENTAL

ARC zahlt $100.000 für besseres Schätzen

Das Alignment Research Center startet einen Wettbewerb. Ziel: bessere Algorithmen, um das Verhalten zufälliger neuronaler Netze vorherzusagen — ohne sie laufen zu lassen.

AI Alignment Forum · 2026-06-02 22:21:01.743297+00:00 · Score 2/10

BULLSHIT

Amazon-Mitarbeiter zocken interne KI-Rangliste

Bei Amazon eskaliert ein absurder Wettbewerb: Angestellte feuern sinnlose Prompts auf KI-Bots ab, nur um in einer internen Bestenliste nach oben zu klettern. Das Ganze hat sogar ...

Golem KI · 2026-05-29 19:21:59.643336+00:00 · Score 6/10

BULLSHIT

Amazon killt KI-Ranking — Mitarbeiter gamen das System

Amazon hat sein internes KI-Leaderboard abgeschaltet. Der Grund: Beschäftigte trieben die Cloud-Rechnung mit sinnloser KI-Nutzung in die Höhe — nur, um im Ranking nach oben zu ...

The Decoder · 2026-05-29 10:18:22.289348+00:00 · Score 7/10

EXPERIMENTAL

Forscher pimpt Isolation Forest gegen Betrug

Ein neues Paper auf arXiv stellt SilIF vor — eine Erweiterung des klassischen Isolation-Forest-Algorithmus für Transaktions-Betrugserkennung.

arXiv AI/ML/NLP · 2026-05-27 07:19:58.056546+00:00 · Score 2/10

EXPERIMENTAL

KI-Radiosender entlarvt: Claude moderiert, Grok versagt

Ein US-Startup hat sechs Monate lang einen Radiosender komplett von KI-Agenten betreiben lassen. Vier Modelle sollten moderieren — die Ergebnisse könnten unterschiedlicher nicht ...

t3n · 2026-05-15 10:18:55.123241+00:00 · Score 3/10

BULLSHIT

Amazon-Mitarbeiter automatisieren Müll für KI-Bonus

Bei Amazon läuft gerade ein absurdes Spiel: Mitarbeiter bauen sinnlose Automatisierungen, nur um in internen KI-Ranglisten zu glänzen. Der Name dafür: "Tokenmaxxing".

The Decoder · 2026-05-12 16:18:49.719165+00:00 · Score 6/10

EXPERIMENTAL

Forscher schnüffeln Neuronalen Netzen ins Gehirn

Ein neues Paper auf arXiv will Neural Networks beim Training live überwachen — bevor sie kollabieren. Das Werkzeug heißt Collapse Index. Klingt nach Sci-Fi, ist aber Mathematik.

arXiv AI/ML/NLP · 2026-05-01 07:20:40.103117+00:00 · Score 2/10

SUCHE

Neue Metrik soll Daten-Mix endlich entzaubern

Neue Metrik entlarvt KI-Drogenjäger als Bluffer

8 Zahlen für die Psyche reichen nicht

MLPerf v6.0: Alle feiern Rekorde, keiner gewinnt

Pointwise-Metriken lügen — neue Studie räumt auf

Amazon killt KI-Leaderboard nach Massen-Betrug

Apple lehrt KI bessere Bildbeschreibungen

Meta belohnt, wer am meisten KI verschwendet

OpenAI zerlegt eigene Modelle in Zahlen

KI baut sich selbst um — 502% Boost

Forscher jagen KI-Halluzinationen in Echtzeit

Sinclair will Menschen 10 Jahre jünger machen

Coralogix kassiert 200 Millionen für Agenten-Aufpasser

ARC zahlt $100.000 für besseres Schätzen

Amazon-Mitarbeiter zocken interne KI-Rangliste

Amazon killt KI-Ranking — Mitarbeiter gamen das System

Forscher pimpt Isolation Forest gegen Betrug

KI-Radiosender entlarvt: Claude moderiert, Grok versagt

Amazon-Mitarbeiter automatisieren Müll für KI-Bonus

Forscher schnüffeln Neuronalen Netzen ins Gehirn