Warum der seltene Einsatz von Techniken des maschinellen Lernens in der translationalen Biomedizin?

8

Dies folgt auf eine frühere Frage. Hier :

Neuronales Netzwerkmodell zur Vorhersage des Behandlungsergebnisses

und könnte als Hinweis auf einen anderen Aspekt dieser Frage angesehen werden:

Anwendung maschineller Lerntechniken in klinischen Studien mit kleinen Stichproben

Vielen Dank an Zach, der vorgeschlagen hat, neu zu posten.

Ich habe jetzt ziemlich ernsthaft über CART, randomForest, Neuronale Netze und maschinelles Lernen im Allgemeinen gelesen, etwas über WEKA und die R-Pakete gelernt, die Stanford Engineering-Vorlesungen gesehen und befolgt http://www.ml-class.org/ Kurs / Klasse / IndexIch bin 3 Kapitel in Hastie. Angesichts der Art von Daten, die wir regelmäßig in der klinisch orientierten Forschung sehen - viele klinische Parameter + viele biochemische Parameter + Stift- und Papiertestdaten +/- Neuroimaging-Daten mit kleinen Zahlen - habe ich das Gefühl, dass mir etwas fehlt. Ich lese nicht regelmäßig über ML-Techniken, die in der Forschungsliteratur angewendet werden. Meine Frage ist: Habe ich mich gerade an etwas geklammert, das zweifelhaft ist und daher von Forschern und Biostatistikern, die sich dessen bewusst sind, mit berechtigtem Misstrauen betrachtet wird, oder werden diese Techniken außerhalb der "Geschäftsanalyse" wirklich übersehen oder gefürchtet? Was hält es "Nische"?

Rosser
quelle
Ich denke, das Problem hier hängt mehr mit den Zeitschriften zusammen, die Sie lesen, als mit irgendetwas anderem. Maschinelles Lernen wird in der modernen translationalen Medizin sehr häufig angewendet, vorausgesetzt, Black-Box-Modelle sind für diese Aufgabe akzeptabel.
Marc Claesen

Antworten:

8

Techniken des maschinellen Lernens sind oft nicht interpretierbar. Außerdem sind sie aus statistischer Sicht eher grob - z. B. machen neuronale Netze keine Annahmen über die Eingabedaten. Ich habe das Gefühl, dass viele Menschen (insbesondere wenn sie einen starken statistischen Hintergrund haben) auf sie herabblicken.

bayerj
quelle
Ja, ich glaube ich habe das verstanden. Aus meiner Sicht sind statistische Methoden jedoch weder rein noch schmutzig, sondern nur die Anwendung von Logik auf Daten. Wenn Sie möchten, dass eine Pille etwas heilt, müssen Sie die Zusammenhänge verstehen und diese in das molekularbiologische Labor bringen. Wenn Sie jedoch nur eine Vorhersage mit Black-Box- (NN / RF) oder Entscheidungsmethoden (CART) treffen möchten, wo liegt das Problem? Sie könnten sogar Einsicht gewinnen. Ist es tiefer als Snobismus?
Rosser
Obwohl die Interpretierbarkeit sicherlich gut ist, bin ich mir nicht sicher, ob ich einen Arzt konsultieren würde, der weiß, was er tut und eine Erfolgsquote von 60% hat, im Vergleich zu einem Arzt, der keine Ahnung hat, aber eine Erfolgsquote von 100% hat;)
blubb
1
Vielleicht interessiert Sie Leo Breimans 'Statistische Modellierung - Die zwei Kulturen', in dem dies ausführlich behandelt wird ( Recognition.su/wiki/images/8/85/Breiman01stat-ml.pdf ). Darüber hinaus gibt es Gründe für diesen Ansatz: - wenn Sie möchten, dass Menschen beispielsweise Dinge interpretieren.
Bayerj
@blubb Ich würde einen Arzt konsultieren, der keine Ahnung hat, aber 100% Erfolgsquote mit einem Konfidenzintervall [98,100] :)
Simone
4

Die Erfolgsbilanz des maschinellen Lernens in der Biomedizin war nicht sehr gut. Frühe Erfolge beim maschinellen Lernen waren Mustererkennungsbereiche mit hohem Signal-Rausch-Verhältnis wie die visuelle Mustererkennung. Das S: N-Verhältnis ist in Biologie und Sozialwissenschaften viel niedriger. Maschinelles Lernen passt effektiv zu vielen Interaktionen zwischen Prädiktoren. Dazu müssen Sie entweder eine große Stichprobengröße oder ein sehr hohes S: N-Verhältnis haben. Siehe Ist Medizin durch maschinelles Lernen fasziniert? . Darüber hinaus haben viele Praktiker des maschinellen Lernens Vorhersageaufgaben als Klassifizierungsaufgaben missverstanden. Weitere Informationen finden Sie hier .

Frank Harrell
quelle