LLMs lesen Krebs-Akten besser als alte Software
Forscher haben Large Language Models auf echte Onkologie-Patientenakten losgelassen. Ergebnis: Die KI fischt Tumor-Daten aus Arzt-Notizen, die bisher in Freitext versauerten.
Das Problem
Onkologen schreiben ihre Befunde am liebsten als Fließtext. Tumorgröße, Biomarker, Chemo-Ergebnis — alles in natürlicher Sprache, nicht in strukturierten Datenfeldern. Für die Forschung ist das ein Albtraum.
Was die Studie untersucht hat
- Aufgabe:** Brustkrebs-Phänotypen aus unstrukturierten Arzt-Notizen extrahieren
- Methode A:** Klassische Ontologie-basierte Systeme (regelbasiert, manuell gepflegt)
- Methode B:** LLMs, die den Freitext direkt parsen
- Datenbasis:** Echte elektronische Patientenakten aus der Onkologie
Warum das nicht trivial ist
Arzt-Notizen sind kein sauberes Paper. Da steht "Tumor li. Brust ca. 2cm, ER+, triple-neg ausgeschlossen" neben Tippfehlern und Abkürzungen. Klassische NLP-Pipelines brauchen für jede Variante eigene Regeln. LLMs fressen den ganzen Kontext und liefern trotzdem.
✅ Pro
- LLMs brauchen keine manuell gepflegten Ontologien
- Skaliert auf neue Krebsarten ohne Neuprogrammierung
- Versteht Kontext und Arzt-Slang
❌ Con
- Halluzinationen bei medizinischen Daten sind kein Spaß
- Kein fertiges Produkt, reine Forschung
- Datenschutz bei Patientenakten ungeklärt
💡 Was das bedeutet
Wenn LLMs zuverlässig Daten aus Millionen von Freitext-Akten ziehen können, wird klinische Forschung massiv schneller. Statt monatelanger manueller Annotation könnten Studien in Tagen starten. Aber: In der Medizin zählt nicht "meistens richtig", sondern "immer richtig" — und da sind wir noch nicht.