Ich bin gespannt auf eine Behauptung im Wikipedia-Artikel zur Effektgröße . Speziell:
[...] Ein statistischer Vergleich, der nicht Null ist, zeigt immer statistisch signifikante Ergebnisse, es sei denn, die Populationsgröße ist genau Null
Ich bin mir nicht sicher, was dies bedeutet / impliziert, geschweige denn ein Argument, um es zu untermauern. Schließlich ist ein Effekt eine Statistik, dh ein Wert, der aus einer Stichprobe mit eigener Verteilung berechnet wird. Bedeutet dies, dass Effekte niemals auf zufällige Variationen zurückzuführen sind (was meiner Meinung nach bedeutet, dass sie nicht signifikant sind)? Überlegen wir uns dann nur, ob der Effekt stark genug ist - einen hohen absoluten Wert zu haben?
Ich denke über den Effekt nach, den ich am besten kenne: Der Pearson-Korrelationskoeffizient r scheint dem zu widersprechen. Warum sollte ein statistisch signifikant sein? Wenn klein ist, ist unsere Regressionsgerade
Wenn small nahe bei 0 liegt, enthält ein F-Test wahrscheinlich ein Konfidenzintervall mit 0 für die Steigung. Ist das nicht ein Gegenbeispiel?
quelle
Antworten:
Nehmen wir als einfaches Beispiel an, ich schätze Ihre Größe mit einem statistischen Hokuspokus.
Sie haben anderen immer gesagt, dass Sie 177 cm groß sind.
Wenn ich diese Hypothese testen (die Körpergröße bis 177 cm, gleich ist ), und ich konnte den Fehler in meiner Messung genug reduzieren, dann könnte ich beweisen , dass Sie nicht in der Tat 177 cm. Wenn ich Ihre Höhe auf genügend Dezimalstellen schätze, würden Sie mit ziemlicher Sicherheit von der angegebenen Höhe von 177,00000000 cm abweichen. Vielleicht sind Sie 177,02 cm groß; Ich muss meinen Fehler nur auf weniger als 0,02 reduzieren, um festzustellen, dass Sie nicht 177 cm sind.h=177
Wie reduziere ich den Fehler in der Statistik? Holen Sie sich eine größere Probe. Wenn Sie eine ausreichend große Stichprobe erhalten, wird der Fehler so klein, dass Sie die kleinsten Abweichungen von der Nullhypothese erkennen können.
quelle
Wie @Kodiologist ausführt, geht es hier wirklich darum, was bei großen Stichproben geschieht. Für kleine Stichprobengrößen gibt es keinen Grund, warum Sie keine falsch positiven oder falsch negativen Ergebnisse erhalten können.
Ich denke, der Test macht den asymptotischen Fall am klarsten. Angenommen, wir haben und wollen vs . Unsere Teststatistik lautet X 1 , ... , X n iid ~ N ( μ , 1 ) H 0 : μ = 0 H A : μ & ne; 0 Z n = ˉ X n - 0z X1,…,Xn∼iidN(μ,1) H0: μ = 0 HEIN: μ ≤ 0
Zn=√X¯n∼ N( μ , 1n) also . Wir interessieren uns für .
Sei unsere Referenzvariable. Unter haben wir also damit wir wählen können, um unsere Fehlerrate vom Typ I wie gewünscht zu steuern . Aber unter so
P(|Zn|≥α)P(|Zn|≥α)=P(Zn≤-α)+P(Zn≥α)=1+Φ(-α-& mgr; √Zn= n--√X¯n∼ N( μ n--√, 1 ) P( | Zn| ≥α)
Der Punkt dabei ist, dass wenn genau gleich ist, unsere Teststatistik die Referenzverteilung hat und wir 5% (oder was auch immer wir wählen) der Zeit ablehnen. Aber wenn nicht genau , dann ist die Wahrscheinlichkeit , dass wir Köpfe ablehnen würden als zunimmt. Die Idee hier ist die Konsistenz eines Tests, , dass unter die Leistung (Wahrscheinlichkeit des Zurückweisens) auf als .0 μ 0 1 n H A 1 n → ∞μ 0 μ 0 1 n HEIN 1 n → ∞
Genauso mit der Teststatistik zum Testen von Vergleich zu mit dem Pearson-Korrelationskoeffizienten. Wenn die Nullhypothese falsch ist, wird die Wahrscheinlichkeit unserer Teststatistik immer größer, sodass die Wahrscheinlichkeit, dass wir sie ablehnen, bei .H A : ρ ≠ ρ 0 1H0: ρ = ρ0 HEIN: ρ ≠ ρ0 1
quelle
Das, was sie sagten, ist wohl falsch, wenn es keinen anderen Grund gibt als die Verwendung von "das passiert immer ".
Ich weiß nicht, ob dies der Kern der Verwirrung ist, die Sie haben, aber ich werde es veröffentlichen, weil ich denke, dass viele dies tun und dies verwirren wird:
„ passiert , wenn groß genug ist , “X n tut nicht Mittel „Wenn , dann “ .n > n0 X
Es bedeutet vielmehr .limn → ∞Pr ( X) = 1
Was sie wörtlich sagen, bedeutet Folgendes:
Was sie versuchen , obwohl zu sagen, ist die folgende:
Hier gibt es entscheidende Unterschiede:
Es gibt keine Garantie. Es ist nur wahrscheinlicher , dass Sie mit einer größeren Stichprobe ein signifikantes Ergebnis erzielen. Jetzt könnten sie hier einem Teil der Schuld ausweichen, denn bisher ist es nur eine terminologische Frage. In einem probabilistischen Zusammenhang es wird verstanden , dass die Aussage „wenn n groß genug ist , dann X“ kann auch so interpretiert werden , „X wird immer wahrscheinlicher , wahr zu sein als n wächst groß“ .
Diese Interpretation geht jedoch aus meinem Fenster, sobald sie sagen, dass dies "immer" passiert. Die richtige Terminologie wäre hier gewesen, zu sagen, dass dies " mit hoher Wahrscheinlichkeit " geschieht 1 .
Dies ist zweitrangig, aber ihr Wortlaut ist verwirrend - es scheint so, als ob Sie die Stichprobengröße so festlegen, dass sie "groß genug" ist, und dann gilt die Aussage für jedes Signifikanzniveau. Doch unabhängig davon , was die genaue mathematische Aussage ist, die wirklich keinen Sinn machen: Sie immer zuerst das Signifikanzniveau beheben, und dann wählen Sie die Stichprobengröße groß genug zu sein.n > n0
Aber der Vorschlag, dass es irgendwie umgekehrt sein kann, betont leider die Interpretation von "groß genug", so dass das obige Problem noch schlimmer wird.
Aber wenn Sie die Literatur verstehen, bekommen Sie, was sie zu sagen versuchen.
(Randbemerkung: Dies ist übrigens genau eines der ständigen Probleme, die viele Leute mit Wikipedia haben. Oft ist es nur möglich zu verstehen, was sie sagen, wenn Sie das Material bereits kennen, daher ist es nur als Referenz oder als Erinnerung gut , nicht als Selbstlernmaterial.)
1 Für die Mitpedanten (hi!) Hat der Begriff eine spezifischere Bedeutung als der, mit dem ich verbunden bin. Der lockerste Fachbegriff, den wir hier wahrscheinlich wollen, ist "asymptotisch fast sicher" . Sehen Sie hier .
quelle
Mein Lieblingsbeispiel ist die Anzahl der Finger nach Geschlecht. Die überwiegende Mehrheit der Menschen hat 10 Finger. Einige haben durch Unfälle die Finger verloren. Einige haben zusätzliche Finger.
Ich weiß nicht, ob Männer (im Durchschnitt) mehr Finger als Frauen haben. Alle leicht verfügbaren Beweise legen nahe, dass sowohl Männer als auch Frauen 10 Finger haben.
Ich bin jedoch sehr zuversichtlich, dass ich bei einer Volkszählung aller Männer und Frauen feststellen würde, dass ein Geschlecht (im Durchschnitt) mehr Finger hat als das andere.
quelle