Gibt es einen Unterschied zwischen den folgenden Begriffen oder sind sie gleich?
- Vorspannen
- Systematische Voreingenommenheit
- Systematische Fehler
Wenn es dann Unterschiede gibt, erklären Sie diese bitte. Können diese Fehler reduziert werden, wenn man die Stichprobengröße erhöht?
UPDATE: Mein Interessengebiet ist die statistische Inferenz. Ich möchte damit sagen, wie wir diesen Begriff als Statistiker unterscheiden.
measurement-error
bias
Biostat
quelle
quelle
Antworten:
Der Begriff "Voreingenommenheit" erscheint in der grundlegenden Literatur zur Statistik auf zwei Arten:
"... die Vorspannung , manchmal als systematischer Fehler bezeichnet, ..." [EL Lehmann, Theorie der Punktschätzung, 1983. Dies ist ein klassischer Text.] In Lehmanns Notation, die Standard ist, E & thgr; ist die Erwartung, wenn die Verteilung durch den Parameter & thgr ; gegeben ist , & dgr ; ein Schätzer ist, X eine Beobachtung ist und g ( & thgr; )E.θ[ δ( X.) ] - g( θ ) Eθ θ δ X g(θ) ist eine Eigenschaft der zu schätzenden Verteilung (der Schätzer). Mit anderen Worten, ist die Beobachtung (oder Sequenz davon) eine Zufallsvariable, die die Schätzung zufällig macht, und die Vorspannung ist die erwartete Abweichung zwischen der Schätzung und dem estimand. Es hängt von der (unbekannten, aber wahren) Verteilung , was es zu einer Funktion der wahren Verteilung macht. Lehmann widmet unverzerrten Schätzern ein ganzes Kapitel: solchen mit einer Vorspannung von Null, unabhängig vom Wert von θ .θ θ
In der Messtheorie ist "Bias" (oder "systematischer Fehler" ) ein Unterschied zwischen der Erwartung einer Messung und dem tatsächlichen zugrunde liegenden Wert. Eine Vorspannung kann beispielsweise durch Kalibrierungsfehler oder instrumentelle Drift verursacht werden. Vergleichen Sie diese Verwendung mit der vorherigen: Hier ist eine Verzerrung eine Eigenschaft einer Messung, die ein physikalischer Prozess ist, während sie zuvor eine Eigenschaft eines statistischen Schätzers war (ein mathematisch definiertes Verfahren, um aus Daten Vermutungen anzustellen).
"Systematische Verzerrung" scheint nur verwendet zu werden, wenn eine Verzerrung von einem zufälligen "Fehler" unterschieden wird: Der Begriff "Fehler" wird hauptsächlich für zufällige Begriffe mit einer Erwartung von Null verwendet.
Die Vorspannung im Messkontext (der zweite Sinn) kann jedoch normalerweise nicht durch weitere Messungen verringert werden: Die Vorspannung ist dem Messvorgang selbst inhärent. Man muss die Vorspannung schätzen und reduzieren, indem man das Messverfahren kalibriert oder mit anderen Verfahren vergleicht, von denen bekannt ist, dass sie keine (oder weniger) Vorspannung aufweisen, die Vorspannung schätzt und diese kompensiert.
Diese kurze Beschreibung der Terminologie, wie sie für statistische Inferenzen verwendet wird, ersetzt nicht die bereits veröffentlichten erweiterten und spezialisierteren Antworten. Stattdessen soll es als Einführung in sie dienen und als milde Warnung, sich vor universellen Verallgemeinerungen in begrenzten Kontexten wie "Alle drei [Begriffe] sind gleichbedeutend mit" systematischem Fehler "" zu hüten, was eindeutig richtig sein kann nur im engeren Sinne, weil die beiden von mir zitierten Definitionen nicht gleichwertig sind. Das Lesen der anderen Antworten hat mich auf die Möglichkeit aufmerksam gemacht, dass die Literatur in Fachgebieten wie der Epidemiologie auf unerwartete Weise bekannte statistische Standardbegriffe wie "Voreingenommenheit" verwendet, von denen einige tatsächlich statistischen Definitionen widersprechen können. Schlussendlich,
quelle
Wenn ich durch meine epidemiologischen Studien etwas gelernt habe, ist dies ein Minenfeld, in dem es kein wahres Richtig oder Falsch gibt. Ich mag Statistik, weil sie zumindest ein mathematisches Fundament hat, während Epidemiologie mehr Meinung ist. Das heißt, ich werde versuchen, Ihre Frage zu beantworten.
Aus M. Porta Ein Wörterbuch der Epidemiologie 5. Aufl. Es wird keine systematische Verzerrung erwähnt, und systematische Fehler sagen „Siehe BIAS“. Dies führt zu einer Verzerrung , die wie folgt beschrieben wird: „Systematische Abweichung von Ergebnissen oder Schlussfolgerungen von der Wahrheit. … Zu Ergebnissen oder Schlussfolgerungen führen, die sich systematisch (im Gegensatz zu zufällig) von der Wahrheit unterscheiden. “ Ich würde sagen, dass es keine unsystematische Verzerrung gibt, da alle Ihre Ergebnisse von der tatsächlichen Risikoschätzung abweichen. Das Wichtigste an Bias ist, dass Sie es nicht reduzieren können, indem Sie die Stichprobengröße erhöhen .
Es gibt viele Arten von Voreingenommenheit. Ich habe gehört, dass einer der ursprünglichen Artikel über Voreingenommenheit über 300 verschiedene Arten enthielt. Das Wichtigste ist, sie zu identifizieren, bevor Sie mit dem Studium beginnen, und dann zu versuchen, Ihr Studium / Experiment einzurichten, um Verzerrungen zu vermeiden. In epidemiologischen Studien ist es sehr nützlich, die Verzerrung in drei Kategorien zu unterteilen:
Auswahlverzerrung ist, wenn Sie den falschen Typ von Personen für Ihre Studie auswählen. Nehmen wir an, Sie sind daran interessiert zu sehen, ob die Arbeit in einer Kohlenmine ein Risiko darstellt. Wenn Sie nach Ihren Studienpersonen in der Kohlenmine suchen, werden Sie möglicherweise feststellen, dass sie gesünder sind als die allgemeine Bevölkerung, nur weil es die sind, die es sind Kranke arbeiten nicht mehr in der Kohlenmine, dh Sie wählen die gesündesten Personen aus und studieren nicht mehr die Quellpopulation, sondern eine Teilstichprobe. Selektionsbias ist normalerweise die bösartigste Art von Bias, weil es so schwer zu identifizieren ist.
Information Bias ist, wenn Ihre Datenerfassung bezüglich Ergebnis oder Exposition fehlerhaft ist. Ein häufiger Fehler ist der Chirurg, der seinen Patienten fragt, ob es ihm nach der Operation besser geht. Hier möchte der Patient den Chirurgen möglicherweise nicht enttäuschen und meldet ein besseres Ergebnis als sonst, und der Chirurg möchte möglicherweise nicht zugeben, dass die Operation ein Misserfolg, eine Berichterstattung und eine Voreingenommenheit der Interviewer war.
Informationsverzerrung wird auch als Beobachtungsverzerrung bezeichnet. Wenn es sich um einen Fehler in einer stetigen Variablen handelt, handelt es sich um einen Messfehler, während bei der Einstellung der Klassifizierung eine Fehlklassifizierung vorliegt. Eine Fehlklassifizierung bedeutet, dass eine Studienperson in die falsche Kategorie geraten kann. Ein Raucher kann entweder zufällig oder durch Berichterstattung über Voreingenommenheit als Nichtraucher falsch klassifiziert werden. Selbst wenn die Fehlklassifizierung zufällig erfolgt (nicht differenzielle Fehlklassifizierung), wird das Risiko systematisch unterschätzt, insbesondere wenn Sie nur wenige Kategorien haben. Obwohl eine ausgezeichnete Studie von Jurek et al. 2005 hat gezeigt, dass Sie vorsichtig sein sollten, wenn Sie diese Annahme anhand einer einzigen Studie treffen. In Bezug auf Ihre Frage könnte ich mir vorstellen, dass dies die „nicht systematische Verzerrung“ ist, auf die sich die systematische Verzerrung bezieht.
Verwirrend sind Faktoren, die sowohl mit der Exposition als auch mit dem Ergebnis verbunden sind und mehr mit dem Studienindividuum zusammenhängen. Zum Beispiel haben Lambe et al. Das Jahr 2006 zeigte, dass das Rauchen während der Schwangerschaft das Risiko für eine geringe Schulleistung erhöht. Bei der Betrachtung von Geschwistern in einer Subpopulation, in der die Mutter während ihrer zweiten Schwangerschaft mit dem Rauchen aufgehört hatte, war die Schulleistung jedoch ebenso schlecht. Dies deutet darauf hin, dass Rauchen nicht die Ursache für schlechte schulische Leistungen ist, sondern möglicherweise ein Störfaktor für andere soziale Faktoren.
Dieser Artikel von Sica et al. 2006 geht näher darauf ein. Worauf Sie vorbereitet sein müssen, ist, dass es auf diesem Gebiet wirklich keinen Konsens für die Terminologie gibt. Mein Traum ist es, dass die WHO eines Tages eine Liste von Definitionen erstellt, die leicht zu verstehen ist, intuitiv Sinn macht und wo die Debatte schließlich enden kann.
quelle
Die Terminologien können von Feld zu Feld variieren. Verwenden Sie jedoch die in den Kommentaren unten definierten Begriffe:
Nein, alle drei entsprechen einem systematischen Fehler.
Nein, eine Erhöhung der Stichprobengröße reduziert zufällige Fehler, nicht systematische Fehler.
Kommentar
Diese Begriffe stammen aus dem Bereich der Epidemiologie, insbesondere aus der Diskussion von Rothman und Kollegen über Fehler in den Kapiteln 9 und 10 der modernen Epidemiologie .
Zusammenfassen:
Das Ziel eines Prüfers besteht darin, eine genaue Schätzung eines Maßes (z. B. Mittelwert, relatives Risiko, Gefährdungsquote usw.) innerhalb einer Population bereitzustellen . Eine genaue Schätzung ist sowohl gültig als auch präzise . Eine gültige Schätzung enthält eine Punktschätzung (z. B. Mittelwert, relatives Risiko, Gefährdungsquote usw.), die nahe am tatsächlichen Wert in der Bevölkerung liegt. Eine genaue Schätzung weist ein enges Konfidenzniveau um die Punktschätzung auf. Darüber hinaus kann eine Schätzung in Bezug auf die Studienpopulation intern und in Bezug auf eine generalisierte Population extern gültig sein.
Abweichungen von der Genauigkeit werden durch Fehler verursacht . Es gibt zwei Haupttypen von Fehlern: systemische Fehler und zufällige Fehler.
Systemfehler, oft als Verzerrung bezeichnet, führen zu Schätzungen, die nicht gültig sind. Systemfehler umfassen Fehler aufgrund von Verwechslungen, Auswahlverzerrungen und Informationsverzerrungen. Verwirrungen können im Allgemeinen mit Techniken wie Schichtung oder Regression korrigiert werden. Auswahl- und Informationsverzerrungen wurden traditionell entweder ignoriert oder in Analysen nur qualitativ bewertet, wahrscheinlich aufgrund der Unkenntnis geeigneter Verzerrungsanalysen. Es gibt jedoch Methoden für die qunatitative Bias-Analyse (z. B. Lash TL und AK Fink (2003) ).
Zufällige Fehler führen zu Schätzungen, die nicht genau sind. Zufälliger Fehler umfasst unter anderem Stichprobenfehler und zufällige Messfehler. Zu den Methoden zur Erhöhung der Präzision gehören die Erhöhung der Studiengröße, die Steigerung der Studieneffizienz und die Präzisionsoptimierung statistischer Analysen wie Pooling und Regression.
Aktualisieren
Um zu veranschaulichen, warum eine Erhöhung der Stichprobengröße den systematischen Fehler bei der Dartboard-Analogie (kopiert aus diesem CV-Beitrag ) nicht verringert :
Unabhängig davon, wie viele Pfeile auf das Brett geworfen werden, wird sich die Punktschätzung nicht in Richtung des wahren Volltreffers verschieben, wenn eine „hohe Tendenz“ vorliegt. Hier ist 'Bias' gleichbedeutend mit 'systematischem Fehler' und 'Varianz' ist gleichbedeutend mit 'Zufallsfehler'.
quelle
Diese Powerpoint- Auszüge enthalten einige Informationen, die das ergänzen, was jthetzel und Max Gordon gegeben haben. Sie orientieren sich an Umfragedaten und sind weder streng noch formal. Wenn Sie diese Art von Antwort wünschen, suchen Sie wahrscheinlich in Lehrbüchern zur Messtheorie oder zu Umfragemethoden.
quelle