Unterschied zwischen Voreingenommenheit, systematischer Voreingenommenheit und systematischem Fehler?

9

Gibt es einen Unterschied zwischen den folgenden Begriffen oder sind sie gleich?

  1. Vorspannen
  2. Systematische Voreingenommenheit
  3. Systematische Fehler

Wenn es dann Unterschiede gibt, erklären Sie diese bitte. Können diese Fehler reduziert werden, wenn man die Stichprobengröße erhöht?

UPDATE: Mein Interessengebiet ist die statistische Inferenz. Ich möchte damit sagen, wie wir diesen Begriff als Statistiker unterscheiden.

Biostat
quelle
1
Es wäre nützlich anzugeben, für welchen Studienbereich Sie sich interessieren. Aus den bereits angebotenen Antworten geht beispielsweise hervor, dass "Voreingenommenheit" spezielle Bedeutungen hat, die sich von denen der statistischen Analyse unterscheiden (in der Theorie der Schätzung ist Voreingenommenheit) die Differenz zwischen der Erwartung eines Schätzers und dem Wert seines Schätzers). Ihre Frage ist jetzt mit "Epidemiologie" gekennzeichnet, da die Antworten derzeit aus diesem Bereich stammen, aber das könnte oder könnte nicht das sein, woran Sie wirklich interessiert sind.
whuber
1
Wie ich verstehe, ist in der Statistik die Verzerrung der Unterschied zwischen Schätzer und Schätzer , während in der Epidemiologie die Verzerrung der nicht zufällige Unterschied zwischen Schätzer und Schätzer ist . Wenn ich Begriffe wie "Voreingenommenheit" und "systematischer Fehler" im Kontext der Biostatistik sehe, denke ich eher an die epidemiologische Interpretation. Andererseits bin ich als Student der Epidemiologie voreingenommen. Diese Folien aus Sander Greenland berühren beide Konzepte, konzentrieren sich jedoch auf die Epidemiologie.
Jthetzel

Antworten:

13

Der Begriff "Voreingenommenheit" erscheint in der grundlegenden Literatur zur Statistik auf zwei Arten:

  1. "... die Vorspannung , manchmal als systematischer Fehler bezeichnet, ..." [EL Lehmann, Theorie der Punktschätzung, 1983. Dies ist ein klassischer Text.] In Lehmanns Notation, die Standard ist, E & thgr; ist die Erwartung, wenn die Verteilung durch den Parameter & thgr ; gegeben ist , & dgr ; ein Schätzer ist, X eine Beobachtung ist und g ( & thgr; )Eθ[δ(X)]g(θ)EθθδXg(θ)ist eine Eigenschaft der zu schätzenden Verteilung (der Schätzer). Mit anderen Worten, ist die Beobachtung (oder Sequenz davon) eine Zufallsvariable, die die Schätzung zufällig macht, und die Vorspannung ist die erwartete Abweichung zwischen der Schätzung und dem estimand. Es hängt von der (unbekannten, aber wahren) Verteilung , was es zu einer Funktion der wahren Verteilung macht. Lehmann widmet unverzerrten Schätzern ein ganzes Kapitel: solchen mit einer Vorspannung von Null, unabhängig vom Wert von θ .θθ

  2. In der Messtheorie ist "Bias" (oder "systematischer Fehler" ) ein Unterschied zwischen der Erwartung einer Messung und dem tatsächlichen zugrunde liegenden Wert. Eine Vorspannung kann beispielsweise durch Kalibrierungsfehler oder instrumentelle Drift verursacht werden. Vergleichen Sie diese Verwendung mit der vorherigen: Hier ist eine Verzerrung eine Eigenschaft einer Messung, die ein physikalischer Prozess ist, während sie zuvor eine Eigenschaft eines statistischen Schätzers war (ein mathematisch definiertes Verfahren, um aus Daten Vermutungen anzustellen).

"Systematische Verzerrung" scheint nur verwendet zu werden, wenn eine Verzerrung von einem zufälligen "Fehler" unterschieden wird: Der Begriff "Fehler" wird hauptsächlich für zufällige Begriffe mit einer Erwartung von Null verwendet.

nxi

v^=1ni=1n(xix¯)2,

x¯=1ni=1nxinn1v^nv^nn1v^

Die Vorspannung im Messkontext (der zweite Sinn) kann jedoch normalerweise nicht durch weitere Messungen verringert werden: Die Vorspannung ist dem Messvorgang selbst inhärent. Man muss die Vorspannung schätzen und reduzieren, indem man das Messverfahren kalibriert oder mit anderen Verfahren vergleicht, von denen bekannt ist, dass sie keine (oder weniger) Vorspannung aufweisen, die Vorspannung schätzt und diese kompensiert.

Diese kurze Beschreibung der Terminologie, wie sie für statistische Inferenzen verwendet wird, ersetzt nicht die bereits veröffentlichten erweiterten und spezialisierteren Antworten. Stattdessen soll es als Einführung in sie dienen und als milde Warnung, sich vor universellen Verallgemeinerungen in begrenzten Kontexten wie "Alle drei [Begriffe] sind gleichbedeutend mit" systematischem Fehler "" zu hüten, was eindeutig richtig sein kann nur im engeren Sinne, weil die beiden von mir zitierten Definitionen nicht gleichwertig sind. Das Lesen der anderen Antworten hat mich auf die Möglichkeit aufmerksam gemacht, dass die Literatur in Fachgebieten wie der Epidemiologie auf unerwartete Weise bekannte statistische Standardbegriffe wie "Voreingenommenheit" verwendet, von denen einige tatsächlich statistischen Definitionen widersprechen können. Schlussendlich,

whuber
quelle
1
Vielen Dank für einen interessanten Beitrag. Ich vermute, dass viele Epidemiologen Begriffe von Statistikern "ausleihen", sie an ihre Umgebung anpassen und dann ... aufgrund des Fehlens einer soliden Basis ... etwas chaotisch werden
Max Gordon
@ Max Gordon: Whuber bietet eine gute Antwort. Vielleicht haben andere Felder nicht willkürlich Begriffe aus der mathematischen Statistik entlehnt, sondern Begriffe definiert, die den Zielen des Feldes entsprechen. Unabhängig davon ist es für Statistiker, Epidemiologen und andere hilfreich, sich dieser subtilen, aber signifikanten Unterschiede in der Terminologie bewusst zu sein, insbesondere angesichts der Verbreitung interdisziplinärer Kooperationsbemühungen.
Jthetzel
+1 tolle Antwort! Sehr klar und dennoch streng und prägnant.
Gung - Reinstate Monica
@jthtzel, die mathematische Statistik muss nicht als etwas interpretiert werden, das mehrere Bedeutungen hat. Es ist eine anwendungsorientierte Wissenschaft, die impliziert, dass sie sich um Probleme im Zusammenhang mit Messung (Statistik) und Wahrheit, dh Mathematik, kümmert. Aus der Literatur geht hervor, dass sich Messfehler zufällig verhalten und eine Statistik (Mittelwert und Varianz) daher nicht beeinflusst wird. Und im Falle eines Mittelwerts könnte eine sogenannte konstante Vorspannung dazu führen, dass sie höher oder niedriger als die wahre Schätzung ist. Varianz und SD bleiben jedoch unberührt.
Subhash C. Davar
4

Wenn ich durch meine epidemiologischen Studien etwas gelernt habe, ist dies ein Minenfeld, in dem es kein wahres Richtig oder Falsch gibt. Ich mag Statistik, weil sie zumindest ein mathematisches Fundament hat, während Epidemiologie mehr Meinung ist. Das heißt, ich werde versuchen, Ihre Frage zu beantworten.

Aus M. Porta Ein Wörterbuch der Epidemiologie 5. Aufl. Es wird keine systematische Verzerrung erwähnt, und systematische Fehler sagen „Siehe BIAS“. Dies führt zu einer Verzerrung , die wie folgt beschrieben wird: „Systematische Abweichung von Ergebnissen oder Schlussfolgerungen von der Wahrheit. … Zu Ergebnissen oder Schlussfolgerungen führen, die sich systematisch (im Gegensatz zu zufällig) von der Wahrheit unterscheiden. “ Ich würde sagen, dass es keine unsystematische Verzerrung gibt, da alle Ihre Ergebnisse von der tatsächlichen Risikoschätzung abweichen. Das Wichtigste an Bias ist, dass Sie es nicht reduzieren können, indem Sie die Stichprobengröße erhöhen .

Es gibt viele Arten von Voreingenommenheit. Ich habe gehört, dass einer der ursprünglichen Artikel über Voreingenommenheit über 300 verschiedene Arten enthielt. Das Wichtigste ist, sie zu identifizieren, bevor Sie mit dem Studium beginnen, und dann zu versuchen, Ihr Studium / Experiment einzurichten, um Verzerrungen zu vermeiden. In epidemiologischen Studien ist es sehr nützlich, die Verzerrung in drei Kategorien zu unterteilen:

  • Auswahlbias
  • Informationsbias
  • Verwirrend

Auswahlverzerrung ist, wenn Sie den falschen Typ von Personen für Ihre Studie auswählen. Nehmen wir an, Sie sind daran interessiert zu sehen, ob die Arbeit in einer Kohlenmine ein Risiko darstellt. Wenn Sie nach Ihren Studienpersonen in der Kohlenmine suchen, werden Sie möglicherweise feststellen, dass sie gesünder sind als die allgemeine Bevölkerung, nur weil es die sind, die es sind Kranke arbeiten nicht mehr in der Kohlenmine, dh Sie wählen die gesündesten Personen aus und studieren nicht mehr die Quellpopulation, sondern eine Teilstichprobe. Selektionsbias ist normalerweise die bösartigste Art von Bias, weil es so schwer zu identifizieren ist.

Information Bias ist, wenn Ihre Datenerfassung bezüglich Ergebnis oder Exposition fehlerhaft ist. Ein häufiger Fehler ist der Chirurg, der seinen Patienten fragt, ob es ihm nach der Operation besser geht. Hier möchte der Patient den Chirurgen möglicherweise nicht enttäuschen und meldet ein besseres Ergebnis als sonst, und der Chirurg möchte möglicherweise nicht zugeben, dass die Operation ein Misserfolg, eine Berichterstattung und eine Voreingenommenheit der Interviewer war.

Informationsverzerrung wird auch als Beobachtungsverzerrung bezeichnet. Wenn es sich um einen Fehler in einer stetigen Variablen handelt, handelt es sich um einen Messfehler, während bei der Einstellung der Klassifizierung eine Fehlklassifizierung vorliegt. Eine Fehlklassifizierung bedeutet, dass eine Studienperson in die falsche Kategorie geraten kann. Ein Raucher kann entweder zufällig oder durch Berichterstattung über Voreingenommenheit als Nichtraucher falsch klassifiziert werden. Selbst wenn die Fehlklassifizierung zufällig erfolgt (nicht differenzielle Fehlklassifizierung), wird das Risiko systematisch unterschätzt, insbesondere wenn Sie nur wenige Kategorien haben. Obwohl eine ausgezeichnete Studie von Jurek et al. 2005 hat gezeigt, dass Sie vorsichtig sein sollten, wenn Sie diese Annahme anhand einer einzigen Studie treffen. In Bezug auf Ihre Frage könnte ich mir vorstellen, dass dies die „nicht systematische Verzerrung“ ist, auf die sich die systematische Verzerrung bezieht.

Verwirrend sind Faktoren, die sowohl mit der Exposition als auch mit dem Ergebnis verbunden sind und mehr mit dem Studienindividuum zusammenhängen. Zum Beispiel haben Lambe et al. Das Jahr 2006 zeigte, dass das Rauchen während der Schwangerschaft das Risiko für eine geringe Schulleistung erhöht. Bei der Betrachtung von Geschwistern in einer Subpopulation, in der die Mutter während ihrer zweiten Schwangerschaft mit dem Rauchen aufgehört hatte, war die Schulleistung jedoch ebenso schlecht. Dies deutet darauf hin, dass Rauchen nicht die Ursache für schlechte schulische Leistungen ist, sondern möglicherweise ein Störfaktor für andere soziale Faktoren.

Dieser Artikel von Sica et al. 2006 geht näher darauf ein. Worauf Sie vorbereitet sein müssen, ist, dass es auf diesem Gebiet wirklich keinen Konsens für die Terminologie gibt. Mein Traum ist es, dass die WHO eines Tages eine Liste von Definitionen erstellt, die leicht zu verstehen ist, intuitiv Sinn macht und wo die Debatte schließlich enden kann.

Max Gordon
quelle
Wenn Sie sagen, dass die Voreingenommenheit niemals abnimmt, wie würden Sie diese Definition rechtfertigen? "Ein asymptotisch unverzerrter Schätzer ist ein Schätzer, der unverzerrt ist, da die Stichprobengröße gegen unendlich tendiert."
Biostat
Ich stimme @jthetzel zu, ich bin mir nicht sicher, ob ich Ihre Frage richtig verstehe. Eine unvoreingenommene Schätzung ist eine Schätzung, bei der es keine Verzerrung gibt und bei der Sie sich auf Ihre Stichprobengröße verlassen, sich zurücklehnen und die Statistiken die Arbeit machen lassen können (... und ja, in der Realität tritt sie wahrscheinlich nie auf, wenn Sie immer eine Verzerrung haben ). Ich versuche es einfach zu halten: Voreingenommenheit ist für mich immer ein systematischer Fehler, aber wie gesagt - es gibt viel zu viele Bücher zu diesem Thema und leider werden viele von Leuten geschrieben, die kaum Statistiken verstehen. Fragen Sie einen Epidemiologen nach Effektmodifikationen - viele (die meisten?) Betrachten es als eine Art Magie ...
Max Gordon
4

Die Terminologien können von Feld zu Feld variieren. Verwenden Sie jedoch die in den Kommentaren unten definierten Begriffe:

Gibt es einen Unterschied zwischen den folgenden Begriffen oder sind sie gleich?

Nein, alle drei entsprechen einem systematischen Fehler.

Können diese Fehler reduziert werden, wenn man die Stichprobengröße erhöht?

Nein, eine Erhöhung der Stichprobengröße reduziert zufällige Fehler, nicht systematische Fehler.

Kommentar

Diese Begriffe stammen aus dem Bereich der Epidemiologie, insbesondere aus der Diskussion von Rothman und Kollegen über Fehler in den Kapiteln 9 und 10 der modernen Epidemiologie .

Zusammenfassen:

Das Ziel eines Prüfers besteht darin, eine genaue Schätzung eines Maßes (z. B. Mittelwert, relatives Risiko, Gefährdungsquote usw.) innerhalb einer Population bereitzustellen . Eine genaue Schätzung ist sowohl gültig als auch präzise . Eine gültige Schätzung enthält eine Punktschätzung (z. B. Mittelwert, relatives Risiko, Gefährdungsquote usw.), die nahe am tatsächlichen Wert in der Bevölkerung liegt. Eine genaue Schätzung weist ein enges Konfidenzniveau um die Punktschätzung auf. Darüber hinaus kann eine Schätzung in Bezug auf die Studienpopulation intern und in Bezug auf eine generalisierte Population extern gültig sein.

Abweichungen von der Genauigkeit werden durch Fehler verursacht . Es gibt zwei Haupttypen von Fehlern: systemische Fehler und zufällige Fehler.

Systemfehler, oft als Verzerrung bezeichnet, führen zu Schätzungen, die nicht gültig sind. Systemfehler umfassen Fehler aufgrund von Verwechslungen, Auswahlverzerrungen und Informationsverzerrungen. Verwirrungen können im Allgemeinen mit Techniken wie Schichtung oder Regression korrigiert werden. Auswahl- und Informationsverzerrungen wurden traditionell entweder ignoriert oder in Analysen nur qualitativ bewertet, wahrscheinlich aufgrund der Unkenntnis geeigneter Verzerrungsanalysen. Es gibt jedoch Methoden für die qunatitative Bias-Analyse (z. B. Lash TL und AK Fink (2003) ).

Zufällige Fehler führen zu Schätzungen, die nicht genau sind. Zufälliger Fehler umfasst unter anderem Stichprobenfehler und zufällige Messfehler. Zu den Methoden zur Erhöhung der Präzision gehören die Erhöhung der Studiengröße, die Steigerung der Studieneffizienz und die Präzisionsoptimierung statistischer Analysen wie Pooling und Regression.

Aktualisieren

Um zu veranschaulichen, warum eine Erhöhung der Stichprobengröße den systematischen Fehler bei der Dartboard-Analogie (kopiert aus diesem CV-Beitrag ) nicht verringert :

Dartscheibe Analogie

Unabhängig davon, wie viele Pfeile auf das Brett geworfen werden, wird sich die Punktschätzung nicht in Richtung des wahren Volltreffers verschieben, wenn eine „hohe Tendenz“ vorliegt. Hier ist 'Bias' gleichbedeutend mit 'systematischem Fehler' und 'Varianz' ist gleichbedeutend mit 'Zufallsfehler'.

jthetzel
quelle
Wenn Sie sagen, dass die Voreingenommenheit niemals abnimmt, wie würden Sie diese Definition rechtfertigen? "Ein asymptotisch unverzerrter Schätzer ist ein Schätzer, der unverzerrt ist, da die Stichprobengröße gegen unendlich tendiert."
Biostat
@biostat: Ein unverzerrter Schätzer enthält keinen systematischen Fehler, könnte aber einen zufälligen Fehler enthalten. Mit zunehmender Stichprobengröße nimmt die Varianz ab und der Schätzer konvergiert auf den wahren Wert des Parameters in der Grundgesamtheit. Ein voreingenommener Schätzer würde systematische Fehler enthalten und nicht auf den wahren Wert des Parameters in der Grundgesamtheit konvergieren (es sei denn, mehrere Verzerrungen im Schätzer heben sich gegenseitig auf).
Jthetzel
@biostat: Vielleicht eine andere Art, sich das vorzustellen: 1) Die Wahrscheinlichkeitsverteilung eines asymptotisch voreingenommenen Schätzers kann unter anderem den wahren Wert bei kleinen Stichprobengrößen enthalten, konvergiert jedoch gegen einen anderen Wert als den wahren Wert, da die Stichprobengröße gegen unendlich tendiert . 2) Die Wahrscheinlichkeitsverteilung eines asymptotisch unverzerrten Schätzers kann unter anderem den wahren Wert bei kleinen Stichprobengrößen enthalten, konvergiert jedoch gegen den wahren Wert, wenn die Stichprobengröße gegen unendlich tendiert.
Jthetzel
Dann sind Bias und Systematic Error nicht gleich? weil hier Voreingenommenheit zufällige Fehler haben kann, wie Sie sagten? Was würdest du denken?
Biostat
@biostat: Wie oben angegeben, können die Terminologien von Feld zu Feld variieren. Ich habe Voreingenommenheit als systematischen Fehler definiert. Sie scheinen Voreingenommenheit als Fehler zu definieren. In der Epidemiologie ist Voreingenommenheit ein systematischer Fehler, zumindest für diejenigen, die der Terminologie von Rothmans kanonischem Lehrbuch folgen. Vielleicht können Sie Ihrer ursprünglichen Frage einen Kontext hinzufügen, um die Antworten in die richtige Richtung zu lenken.
Jthetzel
1

Diese Powerpoint- Auszüge enthalten einige Informationen, die das ergänzen, was jthetzel und Max Gordon gegeben haben. Sie orientieren sich an Umfragedaten und sind weder streng noch formal. Wenn Sie diese Art von Antwort wünschen, suchen Sie wahrscheinlich in Lehrbüchern zur Messtheorie oder zu Umfragemethoden.

rolando2
quelle
2
Während wir gerade dabei sind, finden Sie hier weitere Folien aus Grönland.
Jthetzel