Ich arbeite hauptsächlich mit Nicht-Statistikern in Bereichen wie Medizin, Sozialwissenschaften und Bildung.
Egal, ob ich mit Doktoranden berate, Forschern bei Artikeln helfe oder Artikel für Zeitschriften überprüfe, ich habe oft das Problem, dass jemand (Kunde, Autor, Dissertationskomitee, Zeitschriftenredakteur) eine relativ bekannte Technik anwenden möchte, wenn diese entweder vollständig ist unangemessen oder wenn es bessere, aber weniger bekannte Methoden gibt. Oft werde ich die alternative Technik erklären, aber dann wird mir gesagt, dass "jeder es anders macht".
Mich würde interessieren, wie andere mit solchen Schwierigkeiten umgehen.
ADDITIONEN
@MichaelChernick schlug vor, dass ich einige Geschichten teilen könnte, also werde ich
Momentan arbeite ich mit einer Person, die eine vorherige Arbeit dupliziert und eine unabhängige Variable hinzufügt, um zu sehen, ob dies hilft. Das vorherige Papier ist ehrlich gesagt schrecklich. Abhängige Daten werden so behandelt, als wären sie unabhängig. es ist enorm überzogen und es gibt auch andere Probleme. Dennoch reichte er (mein Kunde) eine frühere Version als Dissertation ein und erhielt nicht nur seinen Abschluss, sondern wurde auch für die Forschung vielfach gelobt.
Oft habe ich versucht, die Leute davon zu überzeugen, Variablen nicht zu dichotomisieren. Dies kommt in der Medizin sehr häufig vor. Ich weise geduldig darauf hin, dass das Dicohotomizing (sagen wir) des Geburtsgewichts in ein niedriges und normales Gewicht (normalerweise 2.500 g) bedeutet, ein 2.499 g schweres Baby wie ein 1.400 g schweres zu behandeln. aber das 2.501 Gramm Baby ganz anders zu behandeln. Der Kliniker stimmt mir zu, dass das albern ist. Dann heißt es so zu machen.
Ich hatte vor langer Zeit einen Studentenkunden, dessen Komitee auf einer Clusteranalyse bestand . Der Student verstand die Methode nicht, die Methode beantwortete keine nützlichen Fragen, aber das war es, was das Komitee wollte, und das war es, was sie bekamen.
Das gesamte Gebiet der statistischen Grafik ist eines, in dem für viele "so hat es Opa gemacht" ausreicht.
Dann gibt es Leute, die scheinen nur Knöpfe zu drücken. Ich erinnere mich an eine Präsentation (nicht von jemandem, dem ich geholfen habe!), Bei der ein ganzer Fragebogen ausgefüllt und der Faktor analysiert worden war. Eine der Variablen, die sie einbezog, war die ID-Nummer!
Oy.
quelle
Antworten:
Das ist eine knifflige Frage!
Zunächst einige Gedanken darüber, warum dies passiert. Ich arbeite in einem Bereich, in dem die Statistik in großem Umfang genutzt wird (oder zumindest werden sollte ), in dem die meisten Praktiker jedoch keine Statistikexperten sind. Infolgedessen sieht man eine Menge von "Ich habe einen Vektor in die t-Test-Funktion von Excel eingefügt und diese Zahl ist herausgefallen. Deshalb wird meine Arbeit von Statistiken gestützt."
Der Hauptgrund, den ich für dieses Ereignis sehe, ist, dass der Mangel an statistischen Kenntnissen ganz oben beginnt. Wenn Ihre Gutachter und das Dissertationskomitee nicht über statistische Techniken auf dem Laufenden sind, müssen Sie die Verwendung von "unkonventionellen" Methoden rechtfertigen. In einer Diplomarbeit habe ich mich beispielsweise dafür entschieden, Geigen-Diagramme anstelle von Box-Diagrammen zu verwenden, um die Form einer Verteilung darzustellen. Die Verwendung dieser Technik erforderte eine umfangreiche Dokumentation in der Arbeit sowie eine längere Diskussion zu meiner Verteidigung, in der alle Komiteemitglieder wissen wollten, was diese seltsame Handlung trotz der Beschreibungen im Text und der Verweise auf das Quellenmaterial bedeutete . Hätte ich gerade einen Boxplot verwendet (der streng genommen weniger zeigt) Informationen in diesem Fall, und kann den Betrachter leicht über die Form einer Verteilung täuschen, wenn es multimodal ist) Niemand hätte etwas gesagt, und meine Verteidigung wäre einfacher gewesen.
Der Punkt ist, dass die Praktiker in nicht-statistischen Bereichen vor einer schwierigen Wahl stehen: Wir können über die richtigen Methoden lesen und sie dann anwenden , was eine Menge Arbeit mit sich bringt, an der keiner unserer Vorgesetzten interessiert ist. oder wir können einfach mit dem Strom gehen, den Stempel auf unsere Papiere und Thesen bekommen und weiterhin falsche, aber herkömmliche Methoden anwenden.
Um Ihre Frage zu beantworten:
Ich denke, ein guter Ansatz ist es, die Konsequenzen eines Fehlens der richtigen Techniken hervorzuheben. Dies könnte bedeuten:
Geben Sie ein Beispiel aus der Praxis, wie jemand auf seinem Gebiet die Konsequenzen einer schlechten Folgerung erlebt hat. Dies ist in einigen Bereichen einfacher als in anderen. Beispiele, bei denen Karrieren geschädigt wurden, sind besonders gut.
Wenn Sie erklären, dass eine inkorrekte Analyse Sie in eine Situation versetzt, in der es sehr unwahrscheinlich ist, dass Ihre Ergebnisse in die Realität übertragen werden, was zu Schäden führen kann (z. B. In meinem Bereich, wenn Ihr KI-System-Prototyp statistisch besser als die Konkurrenz aussieht, dies jedoch tatsächlich der Fall ist) Das gleiche gilt für die nächsten 6 Monate, um eine vollständige Implementierung zu erstellen.
Wählen Sie Techniken, die dem Benutzer viel Zeit sparen. Genug Zeit, damit sie das, was sie sparen, damit verbringen können, den höheren Schichten die Techniken zu erklären.
quelle
Aus der Sicht eines Psychologen mit nur geringer statistischer Raffinesse: Wenn Sie die Methode einführen, führen Sie auch die Werkzeuge ein. Wenn Sie den meisten Forschern in meinem Fachgebiet eine lange Geschichte über eine großartige neue Methode erzählen, werden sie die ganze Zeit besorgt sein, dass die Pointe "ist, und alles, was Sie tun müssen, ist, Ihre Differentialrechnung aufzufrischen und dann eine Zwei zu nehmen einwöchiger Trainingskurs! " (oder "und kaufen Sie ein $ 2000-Statistikpaket!" oder "und passen Sie 5000 Zeilen Python- und R-Code an!"). Wenn es eine Implementierung der Methode gibt, die im Statistikpaket enthalten ist, das sie bereits verwenden, oder in einer freien Software mit einer verständlichen Benutzeroberfläche, und sie können sich innerhalb von ein oder zwei Tagen damit vertraut machen, sind sie möglicherweise bereit zu geben es ist ein Versuch.
Ich bin mir bewusst, dass diese Herangehensweise unpraktisch und unwissenschaftlich wirken kann, aber es fällt den Leuten leicht, wenn sie sich Sorgen über Stipendien und Veröffentlichungen machen, und es ist unwahrscheinlich, dass das Erlernen großer Mengen von Mathematik ihnen dabei hilft, ihren Job zu behalten.
quelle
Danke für diese nette Frage Peter. Ich arbeite an einer medizinischen Forschungseinrichtung und beschäftige mich mit Ärzten, die in medizinischen Fachzeitschriften forschen und publizieren. Oft sind sie mehr daran interessiert, ihre Arbeit zu veröffentlichen, als "die Statistiken vollständig richtig zu machen". Wenn ich also eine ungewöhnliche Technik vorschlage, verweisen sie auf ein ähnliches Papier und sagen: "Sehen Sie, sie haben es so gemacht und ihre Ergebnisse veröffentlicht."
Ich denke, es gibt ein Problem, wenn die veröffentlichte Arbeit wirklich schlecht ist und Fehler aufweist. Es ist schwierig zu argumentieren, obwohl ich einen guten Ruf habe. Einige Doktoren haben große Egos und denken, dass sie fast alles lernen können. Sie glauben, die Statistiken zu verstehen, wenn sie dies nicht tun, und können darauf bestehen. Es kann frustrierend werden. Wenn es sich um einen Test handelt und Wilcoxon geeigneter ist, lasse ich sie einen Wilk Shapiro-Test durchführen. Wenn die Normalität abgelehnt wird, schließen wir beide Methoden ein und erklären, warum Wilcoxon besser ist. Ich kann sie manchmal überzeugen und oft sind sie für Statistiken auf mich angewiesen, sodass ich ein bisschen mehr Einfluss habe als ein allgemeiner Berater.
Ich bin auch auf eine Situation gestoßen, in der ich Kaplan-Meier-Kurven für sie gemacht habe, und wir haben den Log-Rank-Test verwendet, aber Wilcoxon hat ein anderes Ergebnis geliefert. Es fiel mir schwer, mich zu entscheiden, und in solchen Situationen denke ich, ist es am besten, beide Methoden vorzustellen und zu erklären, warum sie sich unterscheiden. Das Gleiche gilt für die Verwendung von Peto vs Greenwood-Konfidenzintervallen für die Überlebenskurve. Es kann schwierig sein, die Annahme des Cox-Anteils zu erklären, und sie interpretieren Quotenverhältnisse und das relative Risiko häufig falsch.
Es gibt keine einfache Antwort. Ich hatte hier einen Chef, der ein erstklassiger medizinischer Forscher in der Kardiologie war und manchmal als Referent für Zeitschriften fungiert. Er befasste sich mit einem Artikel, der sich mit Diagnose befasste, und verwendete AUC als Maß. Er hatte noch nie zuvor eine AUC-Kurve gesehen und kam zu mir, um zu sehen, ob ich sie für gültig hielt. Er hatte Zweifel. Es stellte sich als angemessen heraus und ich erklärte es ihm so gut ich konnte.
Ich habe versucht, Ärzten Vorlesungen über Biostatistik zu halten, und habe Biostatistik an öffentlichen Gesundheitsschulen unterrichtet. ich versuche es besser zu machen als andere und habe 2002 ein buch für den einführungskurs der gesundheitswissenschaftlichen schwerpunkte mit einem epidemiologen als koautor herausgebracht. Wiley möchte, dass ich jetzt eine zweite Ausgabe mache. 2011 veröffentlichte ich ein kompakteres Buch, in dem ich nur das Wesentliche zu behandeln versuchte, damit sich vielbeschäftigte MDs die Zeit nehmen, es zu überarbeiten und darauf zu verweisen. So gehe ich damit um. Vielleicht können Sie Ihre Geschichten mit uns teilen.
quelle
In meiner Karriere habe ich viel interdisziplinär geforscht und habe zu verschiedenen Zeiten eng mit Drogenforschern, Epidemiologen, Biologen, Kriminologen und Ärzten zusammengearbeitet. Dies umfasste typischerweise die Analyse von Daten, bei denen die üblichen "vorgefertigten" Ansätze aus verschiedenen Gründen fehlschlagen würden (z. B. eine Kombination aus voreingenommenen Stichproben und gruppierten, longitudinalen und / oder räumlich indizierten Daten). Ich habe auch ein paar Jahre in Teilzeit als Berater an einer Graduiertenschule gearbeitet, wo ich mit Menschen aus den verschiedensten Bereichen zusammengearbeitet habe. Also musste ich viel darüber nachdenken.
Ich habe die Erfahrung gemacht, dass das Wichtigste darin besteht, zu erklären, warum die üblichen Vorgehensweisen in Dosen unangemessen sind und den Wunsch der Person nach "guter Wissenschaft" ansprechen. Kein seriöser Forscher möchte etwas veröffentlichen, das in seinen Schlussfolgerungen wegen unangemessener statistischer Analyse eklatant irreführend ist. Ich habe noch nie jemanden getroffen, der etwas in der Richtung sagt: "Es ist mir egal, ob die Analyse korrekt ist oder nicht, ich möchte nur, dass dies veröffentlicht wird", obwohl ich mir sicher bin, dass es solche Leute gibt beenden Sie die berufliche Beziehung, wenn überhaupt möglich. Als Statistiker ist es mein Ruf, der Schaden nehmen könnte, wenn jemand, der tatsächlich weiß, wovon er spricht, die Zeitung liest.
Ich gebe zu , es kann jemanden zu überzeugen , eine Herausforderung sein , dass eine bestimmte Analyse ungeeignet ist , aber ich denke , dass als Statistiker sollten wir (a) haben das Wissen notwendig , um genau zu wissen , was mit dem „Konserven“ -Ansatz schief gehen kann , und (b) habe Die Fähigkeit, es zu erklären, ist einigermaßen nachvollziehbar. Sofern Sie nicht als Statistik- oder Mathematikprofessor arbeiten, besteht ein Teil Ihrer Aufgabe darin, mit Nicht-Statistikern zusammenzuarbeiten (und manchmal sogar, wenn Sie ein Statistik- / Mathematikprofessor sind).
Zu (a) : Wenn der Statistiker nicht über dieses Wissen verfügt, warum würde er dann den Dosenansatz entmutigen? Wenn der Statistiker sagt "benutze zufällige Effektmodelle", aber nicht erklären kann, warum die Annahme von Unabhängigkeit ein Problem ist, sind sie dann nicht schuldig, dem Dogma in der gleichen Weise nachzugeben, wie der Klient es ist? Jeder Gutachter, ob Statistiker oder nicht, kann einen statistischen Modellierungsansatz pedantisch kritisieren, denn seien wir ehrlich - alle Modelle sind falsch. Es erfordert jedoch Fachwissen, um genau zu wissen, was schief gehen könnte.
In Bezug auf (b) habe ich festgestellt, dass grafische Darstellungen, was schief gehen könnte, in der Regel am häufigsten "ins Schwarze treffen". Beispiele:
Eine andere häufige Situation (auch von Peter erwähnt) erklärt, warum die Annahme der Unabhängigkeit eine schlechte Idee ist. Sie können beispielsweise mit einer grafischen Darstellung zeigen, dass eine positive Autokorrelation in der Regel Daten erzeugt, die stärker "gruppiert" sind, und die Varianz aus diesem Grund unterschätzt wird, um eine Vorstellung davon zu vermitteln, warum die naiven Standardfehler tendenziell zu klein sind. Sie können die Daten auch mit der angepassten Kurve zeichnen, die Unabhängigkeit voraussetzt, und Sie können visuell sehen, wie die Cluster die Anpassung beeinflussen (wodurch die Stichprobengröße effektiv verringert wird), auf eine Weise, die in unabhängigen Daten nicht vorhanden ist.
Es gibt eine Million anderer Beispiele, aber ich arbeite hier mit räumlichen und zeitlichen Einschränkungen :) Wenn Bilder aus irgendeinem Grund nicht funktionieren (z. B. um zu zeigen, warum ein Ansatz zu schwach ist), sind Simulationsbeispiele ebenfalls eine Option, die ich verwendet habe von Zeit zu Zeit.
quelle
Einige zufällige Gedanken, da dies ein komplexes Problem ist.
Ich bin der Meinung, dass ein großes Problem der Mangel an Mathematikausbildung in einer Vielzahl von Fachdisziplinen und Abschlussprogrammen ist.
Ohne ein mathematisches Verständnis der Statistik wird es zu einem Bündel von Formeln, die je nach Fall angewendet werden müssen.
Um ein wirkliches Verständnis der Sache zu erlangen, sollten die Professoren auch über die ursprünglichen Probleme sprechen, mit denen die ursprünglichen Autoren zum Zeitpunkt der Veröffentlichung ihrer Ansätze konfrontiert waren. Daraus kann man mehr lernen als durch das Lesen von Tausenden Büchern zu diesem Thema.
Statistik ist eine Toolbox zum Lösen von Problemen, aber sie ist auch eine Kunst und hat dieselben Probleme wie jede andere Kunst.
Man kann lernen, wie man mit einem Instrument Geräusche macht. Aber in der Lage zu seinein instrument "spielen" man wird kein musiker.
Es ist jedoch nicht ungewöhnlich, Menschen zu finden, die sich als Musiker verstehen, ohne ein einziges Konzept von Rhythmus, Melodie und Harmonie studiert zu haben.
Um Artikel zu veröffentlichen, müssen die meisten Leute die Konzepte hinter einer Formel weder kennen noch verstehen. Heutzutage müssen Wissenschaftler nur wissen, welche Taste sie drücken müssen und wann sie gedrückt werden müssen, Punkt.
Das hat also nichts mit dem "Ego" der MDs zu tun. Dies ist ein subkulturelles Problem, ein Problem, das mehr mit Bildung, Bräuchen und Werten der wissenschaftlichen Gemeinschaft zu tun hat.
Was kann man in einer Zeit erwarten, in der Tausende und Abertausende nutzloser Artikel und Bücher veröffentlicht werden, um bestimmte akademische Anforderungen / Richtlinien zu erfüllen? In einer Zeit, in der die Anzahl der Veröffentlichungen wichtiger ist als deren Qualität?
Mainstream-Wissenschaftler sorgen sich nicht mehr um die gute Wissenschaft. Sie sind Sklaven von Zahlen. Sie sind vom Verwaltungsfehler unserer Zeit betroffen (oder infiziert).
Aus meiner Sicht sollte ein guter Statistikkurs die mathematischen, historischen und philosophischen Grundlagen des untersuchten Ansatzes einschließen und immer die verschiedenen möglichen Wege hervorheben für die Lösung eines einzelnen Problems nehmen.
Wenn ich Professor für Statistik / Wahrscheinlichkeitsrechnung wäre, würde meine erste Vorlesung (en) Problemen wie gewidmet seinKarten mischen oder eine Münze werfen . Das bringt das Publikum in die richtige Position zum Zuhören ... wahrscheinlich.
quelle