Das was man sieht, sagt einem nichts, wenn man nicht schon vorher weiß wonach man Ausschau halten soll

schreibt der Medizinnobelpreisträger Sir Peter B. Medawar. Treffender könnte man wohl auch für die Radiologie den Stellenwert umfassender Erfahrung nicht formulieren. Johnson et al. schickten sich nun an, heraus zu finden, wie weit die Segnungen der modernen Computerapplikation hier helfen könnten. Ein Structured-reporting-System sollte helfen, die Befundqualität zu verbessern.

Angetreten zum Beweis waren 34 Residents im 2. bis 4. Jahr, 25 MRT-Untersuchungen des Kopfs mit der Fragestellung „stroke“ und eine Befundungssoftware. Sechzehn von ihnen befundeten die 25 Untersuchungen konventionell diktiert mit einem freien Text und wiederholten dies nach 4 Monaten mit denselben Bildern.

Achtzehn von ihnen befundeten in zweiter Runde nach 4 Monaten mit einem Befundungssystem, bei dem sie Befunddeskriptoren und Textbausteine auswählen konnten. Validiert wurden alle Befunde von in der Neuroradiologie erfahrenen Kollegen mit einem 100-Punkte-Score bzgl. Richtigkeit („accuracy“) und Vollständigkeit („completeness“).

Während nun die konventionellen Befunder innerhalb der 4 Monate annähernd konstant blieben (Richtigkeit 91,4 bzw. 92,4 und Vollständigkeit 67,8 bzw. 71,7), rutschten die strukturierten Kollegen tief nach unten. Die Richtigkeit sank von 91,5 auf 88,7, die Befundvollständigkeit erschreckend von 68,7 auf 54,3.

Wie? Zumindest vollständiger hätten die strukturierten Befunde bitteschön sein müssen.

Nein, verlesen haben wir uns nicht: Zumindest diese Software hat hier nichts gebracht, und das Hirn ist ein besserer Computer als manche vermuten. Verallgemeinerungen hingegen sind unzulässig, zumal der Artikel auch nicht ganz klar zu erkennen gibt, ob es sich bei der Anwendung um eine Befundungsoberfläche handelt, die verschiedene Kriterien und Textvorlagen zur Auswahl gibt, oder um ein vollständiges SR-System nach DICOM-Kriterien.

Die Computeranwendung kann letztlich nicht besser sein als ihr Schöpfer, d. h. es muss vorab anatomisch und pathologisch vollständig sein. Vermuten muss man, dass dies hier nicht der Fall war und es mehr an dem getesteten System selbst als an der SR-Befundung im Allgemeinen liegt. Nun, immerhin ein Anlass zu prüfen, ob es auch besser geht…!

Ein Nebenergebnis zum Schmunzeln gab es auch noch: Da nun schon mal verschiedene Weiterbildungsjahre angetreten waren, konnte man auch innerhalb dieser den direkten Vergleich antreten. Bezogen auf die Befundrichtigkeit lag das 3. Jahr vorn, bezogen auf die Vollständigkeit das 2. Jahr; die Kollegen des 4. Jahres bildeten unabhängig von der Art der Befundung das Schlusslicht. Auch Überschätzung der eigenen Routine ist der Befundqualität abträglich, auch wenn man schon vorher wusste, wonach man Ausschau halten sollte… Da gab es die Phasen des Lernens: Die berechtigte Unsicherheit, die unberechtigte Sicherheit und schließlich die gerechtfertigte Sicherheit. Und zuletzt, bei ehrlicher Einsicht, die unberechtigte Unsicherheit, die den wirklich Erfahrenen auszeichnet.