Wie können Epidemiologen / Mitarbeiter des öffentlichen Gesundheitswesens sanft in die fortschrittliche Vorhersagemodellierung eingeführt werden?

8

Aus sozialwissenschaftlichen und epidemiologischen Gründen wurden meine Mitarbeiter in Regression der kleinsten Quadrate, logistischer Regression und Überlebensanalyse geschult. Sie möchten 95% -Konfidenzintervalle und p-Werte mit den Parameterkoeffizienten sehen und misstrauen aktuelleren Vorhersagewerkzeugen wie neuronalen Netzen, CART, Bagging & Boosting sowie bestraften Regressionstechniken.

RobertF
quelle
4
Mein kurzer Kurs richtet sich unter anderem an dieses Publikum. Informationen einschließlich Handouts finden Sie auf der Website für die vollständige Semesterversion des Kurses: biostat.mc.vanderbilt.edu/CourseBios330 . Eines der vielen Dinge, die ich behandele, ist, warum es unangemessen ist, logistische Regressionskoeffizienten zu protokollieren, um Quotenverhältnisse zu erhalten. Dies steht im Zusammenhang damit, dass Effekte nichtlinear sein können und z. B. Quotenverhältnisse zwischen Quartilen erhalten werden.
Frank Harrell
2
Ich mag die folgenden 2 Bücher: Eine Einführung in das statistische Lernen: mit Anwendungen in R (James, Witten, Hastie und Tibshirani). Die Elemente des statistischen Lernens: Data Mining, Inferenz und Vorhersage (Hastie, Tibshirani, Friedman). Ich finde auch, dass Epidemiologen parametrische Regressionsmodelle (die von Ihnen erwähnten GLM-Modelle) zur Schätzung und Inferenz gegenüber modernen semi / nicht parametrischen Regressionsmodellen bevorzugen. Ich nehme an, weil sich ein Großteil ihrer Arbeit auf die Entdeckung / Erklärung von Risiko- / Schutzfaktoren konzentriert, anstatt flexible Regressionsanpassungen (zur Vorhersage) zu generieren?
Chris
2
@ RobertF: Das gilt für die meisten Berufe (Trägheit?). Epidemiologen sind jedoch in der Regel an Erklärungsmodellen interessiert, und es ist nicht immer ganz klar, wie neuere prädiktive Ansätze wie die Bestrafung eingesetzt werden sollten, wenn beispielsweise verwirrende Wechselwirkungen bei einer Exposition von Interesse bewertet werden sollen. Frank Harrells Kurs, Buch und seine Abteilung. Die Website enthält viele nützliche Materialien, die auch in der Epidemiologie angewendet werden können.
Thomas Speidel
1
@ RobertF: Das ist etwas, das ich nur schwer erfassen kann. Wenn wir Effektschätzungen absichtlich voreingenommen machen, um die Überanpassung zu reduzieren, wie können wir sie dann so behandeln, als wären sie nicht voreingenommen, wenn wir sie interpretieren wollen?
Thomas Speidel
1
@Chris Eines der häufigsten Werkzeuge zur Überlebensanalyse, die Epidemiologen verwenden, ist ein semiparametrisches Modell.
Fomite

Antworten:

6

Ich werde als Epidemiologe abwägen.

Ich kann sehen, dass Trägheit einsetzt, wenn Forscher und Fachleute im Gesundheitswesen in das mittlere Management und darüber hinaus wechseln und nicht mehr mit neuen Entwicklungen in der Statistik in Verbindung stehen.

Erstens würde ich Ihnen dringend raten, nicht davon auszugehen, dass dies einfach Trägheit ist, entweder in Form der Disziplin, die keine neuen Techniken anwenden möchte, oder wenn Ihre Mitarbeiter nicht mit neuen Entwicklungen in der Statistik in Berührung kommen. Sie können an akademischen epidemiologischen Konferenzen teilnehmen, auf denen neue und sehr methodisch anspruchsvolle Arbeiten durchgeführt werden, und Sie müssen immer noch nicht unbedingt viel über prädiktive Modellierung herausfinden.

Der Hinweis ist im Namen. Vorausschauende Modellierung.

Die Epidemiologie als Fachgebiet ist nicht besonders an Vorhersagen für sich selbst interessiert. Stattdessen liegt der Schwerpunkt auf der Entwicklung ätiologischer Erklärungen für beobachtete Krankheitsbilder in einer Population. Die beiden sind verwandt, aber unterschiedlich, und dies führt oft zu einem philosophischen Misstrauen gegenüber moderneren Klassifizierungs- und Vorhersagetechniken, die lediglich versuchen, die prädiktive Wirkung eines Modells zu maximieren. Am äußersten Ende stehen die Personen, die der Meinung sind, dass die Variablenauswahl in erster Linie unter Verwendung eines gerichteten azyklischen Graphen durchgeführt werden sollte, der als das Gegenteil der Richtung der prädiktiven Modellierung angesehen werden könnte.

Dies führt dazu, dass es nicht Teil ihres Hintergrunds ist, nicht etwas, dem sie in der Literatur häufig begegnen, und um ganz ehrlich zu sein, eine hohe Wahrscheinlichkeit, dass sie über Menschen, die die Probleme, die sie versuchen, nicht wirklich verstehen, damit in Berührung gekommen sind lösen.

Dies ist in den Kommentaren ein perfektes Beispiel:

Das wirft einige Leute um - die Tatsache, dass wir absichtlich Vorurteile in die bestrafte Regression einführen, um die Vorhersagegenauigkeit zu verbessern

Fast jeder Epidemiologe, den ich kenne, würde, wenn Sie ihn auswählen würden, eine Verringerung der Voreingenommenheit gegenüber einer Erhöhung der Genauigkeit wählen.

Das heißt nicht, dass es nie zur Sprache gebracht wird. Es gibt Zeiten, in denen Vorhersagemodelle verwendet werden - häufig in klinischen Fällen, in denen die Vorhersage des Ergebnisses dieses bestimmten Patienten von erheblichem Interesse ist, oder in der Erkennung von Ausbrüchen, in denen diese Techniken nützlich sind, weil wir nicht wissen, was kommt, und nicht ätiologisch machen können Argumente. Oder wenn Vorhersage wirklich das Ziel ist - zum Beispiel in vielen Expositionsschätzungsmodellen. Sie sind nur eine Nische auf dem Gebiet.

Fomite
quelle
Ich entschuldige mich, wenn dies etwas anstößig ist, ich meine es nicht so. Wie viel Ausbildung eines Epidemiologen ist in Statistik und / oder Mathematik? Rein aus eigener Erfahrung waren die Epidemiologen, die ich getroffen habe (und ich habe eine beträchtliche Anzahl getroffen), statistisch schlecht gerüstet, um die von ihnen gezeigten Modelle zu verwenden und zu interpretieren. Viele von ihnen kannten grundlegende Konzepte wie die Korrektur mehrerer Tests und andere praktische Probleme nicht. Ich habe mich gefragt, ob Sie dies kommentieren könnten. Habe ich einfach schlechte Epidemiologen getroffen oder ist es ein disziplinweites Phänomen? Wieder hoffe ich, dass das nicht war
Chris C
1
@ChristC Ein Teil des Problems ist, verglichen mit "Statistiker", Epidemiologe ist ein sehr weites Feld. Es gibt viele Leute, die mit 2x2-Tabellen und Mathematik davonkommen können, die nicht weniger komplex sind als lange Unterteilungen, denn für die meisten lokalen Probleme der öffentlichen Gesundheit ist das genug. 1 / n
Fomite
1
Es gibt auch einige Macken auf dem Gebiet (Charlie Poole von UNC hat ein Argument bezüglich: Mehrfachvergleichskorrekturen sind ein fehlerhaftes Konzept in der Epidemiologie) und einige mangelnde Bildung, weil die meisten Epis Benutzer von Modellen sind, und um ehrlich zu sein, sind Statistikprogramme häufig völlig desinteressiert daran, sie zu unterrichten. 2 / n
Fomite
1
Am anderen Ende des Spektrums arbeiten einige hochentwickelte Methodologen an epifokussierten Problemen - kausale Inferenz, Systemmodelle, konkurrierende Risiken usw., die sich äußerst gut auskennen. Es hängt alles sehr stark davon ab, welche Art von Arbeit sie machen, welchen Hintergrund sie haben usw. n / n
Fomite
1
@ChrisC Ein besonders anschauliches Beispiel, an das ich mich gerade erinnerte. Auf derselben Konferenz, in derselben Sitzung , präsentierte ich einen neuen (wenn auch etwas abgeleiteten) Ansatz zur Modellierung der Saisonalität unter Verwendung von Regressionsmodellen mit harmonischen Funktionen. Das Gespräch vor mir? Kreisdiagramme. Beide könnten sehr glaubwürdig als "Epidemiologie" bezeichnet werden.
Fomite