Mehr Ärzte, bessere Diagnosen
Zweitmeinung lohnt sich
Ein Team von Ärzten ermöglicht eine präzisere Diagnose als ein Individuum: Die Genauigkeit schwankt zwischen 63 Prozent mit einem und 86 Prozent mit neun Ärzten. Darauf deuten Fallbeurteilungen auf einer Onlineplattform.
Veröffentlicht:Die Studie in Kürze
- Ergebnis: Die Diagnose eines Ärztekollektivs ist wesentlich genauer als die eines einzelnen Arztes. Eine Analyse ergab bis zu 30 Prozentpunkte Unterschied bei der Trefferrate auf einer Onlineplattform.
- Einschränkung: Rund 80 Prozent der Teilnehmer waren Assistenzärzte oder Studenten.
Viele Köche mögen zwar den Brei verderben, viele Ärzte verbessern aber die Diagnose, haben US-Forscher mit einer Analyse auf der Online-Plattform des „Human Diagnosis Project“ herausgefunden.
Dort können Ärzte Fallberichte mit bestätigten Diagnosen eingeben, ein Maschinen-Lernprozess verwertet die Daten und kann bei unklaren Fällen die wahrscheinlichsten Diagnosen auflisten. Dies können etwa Studenten nutzen, um Hinweise auf die Diagnose zu erhalten.
Oder aber Ärzte und Studenten trainieren anhand der bestätigten Diagnosen ihre diagnostischen Fähigkeiten. Zusätzlich werden Fälle von anderen Ärzten bewertet, die wiederum die aus ihrer Sicht wahrscheinlichsten Diagnosen listen.
Forscher um Dr. Michael Barnett von der Harvard School of Public Health in Boston haben nun geschaut, wie groß die Übereinstimmung von einzelnen Ärzten und einem Ärztekollektiv mit bis zu neun Teilnehmern ist, wenn sie Lehrbeispiele beurteilen (JAMA Netw Open 2019;2: e190096).
Es zeigte sich, dass die Genauigkeit der Diagnose zunimmt, je mehr Ärzte sich beteiligen. Allerdings verläuft die Kurve asymptotisch auf eine Genauigkeit von 90 Prozent zu – ab einer bestimmten Zahl führen mehr Ärzte zu keiner weiteren Verbesserung.
Beispiele aus der Praxis
Für die Analyse haben die Forscher 1572 Lehrbeispiele ausgewählt, die von mindestens zehn Ärzten beurteilt worden waren. Alle Lehrbeispiele stammen aus der klinischen Praxis und enthalten Angaben zu Anamnese, körperlichen und labormedizinischen Untersuchungen, Krankheitsverlauf sowie Diagnose oder Differenzialdiagnose.
Ausgewertet wurden Diagnosen von etwas mehr als 2000 Usern, die mit der Plattform vertraut waren, also schon mehrere Beurteilungen abgegeben hatten. Die meisten der User hatten mehrere Lehrbeispiele beurteilt.
Die Teilnehmer waren zum größten Teil Ärzte in der Facharztausbildung (60 Prozent), 20 Prozent stellten Medizinstudenten, die übrigen 20 Prozent Oberärzte. Die Assistenz- und Oberärzte arbeiteten meist in der Inneren Medizin oder im allgemeinmedizinischen Bereich, 90 Prozent stammten aus den USA.
Für die Berechnungen wurde eine Diagnose als korrekt beurteilt, wenn die ersten drei Vorschläge die hinterlegte Diagnose enthielten. Entsprechend berechneten die Forscher die drei wahrscheinlichsten Diagnosen eines Kollektivs von zwei bis neun Ärzten und prüften, ob auch diese Liste die hinterlegte Diagnose enthielt.
Kollektiv um 26 Punkte genauer
Nach diesen Kriterien lagen einzelne Ärzte über alle Lehrbeispiele gemittelt zu 63 Prozent richtig. Assistenzärzte erreichten eine Genauigkeit von 66 Prozent, Oberärzte von 64 Prozent, Medizinstudenten von 56 Prozent.
Poolten die Forscher die Antworten von mehreren Ärzten, nahm die Genauigkeit mit der Zahl der Ärzte zu und erreichte über alle Ärzte und Fälle gemittelt bei neun Ärzten knapp 86 Prozent – was einer absoluten Verbesserung der Genauigkeit um 26 Prozentpunkte gegenüber einer Einzelmeinung entspricht.
Doch schon zwei Ärzte führten zu einer Verbesserung der Genauigkeit um rund 13 Punkte – es lohnt sich für Patienten also, eine zweite Meinung einzuholen. Wurden nur Ärzte berücksichtigt, die mindestens fünf Fälle beurteilten, so erreichte die Genauigkeit bei einem Neuner-Kollektiv knapp 90 Prozent; nur 70 Prozent dagegen bei Ärzten, die im Kollektiv nur eine Diagnose wagten.
Der Unterschied zwischen der korrekten Einzelmeinung und der des Kollektivs hing stark von den Fällen ab. Am geringsten war er mit 17 Prozentpunkten bei Patienten mit Bauchschmerzen als vorherrschendem Symptom – hier lagen auch schon die einzelnen Ärzte mit ihrer Diagnose zu über 70 Prozent richtig.
30 Prozentpunkte Unterschied berechneten die Forscher hingegen bei den Diagnosen zu Patienten mit Fieber als Hauptsymptom – hier kamen die einzelnen Ärzte auf eine Genauigkeit von lediglich etwas über 50 Prozent.
Entsprechende Resultate erzielten die Forscher um Barnett, wenn sie Diagnosen von Spezialisten in ihrem Spezialgebiet auswerteten. Auch hier erreichte eine Gruppe von neun Spezialisten eine Genauigkeit von 86 Prozent, ein einzelner lag hingegen im Schnitt nur zu 66 Prozent richtig.
Das Ärztekollektiv kommt nach diesen Berechnungen also stets zu einer präziseren Diagnose als ein einzelner Arzt.