Was ist der Unterschied zwischen Z-Scores und p-Werten?

11

In Netzwerkmotivalgorithmen scheint es durchaus üblich zu sein, beide a zurückzugeben p-Wert als auch einen Z-Score für eine Statistik zurückzugeben: "Das Eingabenetzwerk enthält X Kopien des Untergraphen G". Ein Untergraph gilt als Motiv, wenn er erfüllt

  • p-Wert <A,
  • Z-Score> B und
  • X> C für einige benutzerdefinierte (oder Community-definierte) A, B und C.

Dies motiviert die Frage:

Frage : Was sind die Unterschiede zwischen p-Wert und Z-Score?

Und die Unterfrage:

Frage : Gibt es Situationen, in denen der p-Wert und der Z-Score derselben Statistik auf entgegengesetzte Hypothesen hindeuten könnten? Sind die oben aufgeführten ersten und zweiten Bedingungen im Wesentlichen gleich?

Douglas S. Stones
quelle

Antworten:

9

Aufgrund Ihrer Frage würde ich sagen, dass es keinen Unterschied zwischen den drei Tests gibt. Dies bedeutet, dass Sie immer A, B und C auswählen können, sodass unabhängig vom verwendeten Kriterium dieselbe Entscheidung getroffen wird. Obwohl der p-Wert auf derselben Statistik basieren muss (dh der Z-Score)

Um den Z-Score zu verwenden, wird angenommen, dass sowohl der Mittelwert als auch die Varianz σ 2 bekannt sind, und die Verteilung wird als normal (oder asymptotisch / ungefähr normal) angenommen. Angenommen, das p-Wert-Kriterium beträgt die üblichen 5%. Dann haben wir:μσ2

p=Pr(Z>z)<0.05Z>1.645Xμσ>1.645X>μ+1.645σ

Wir haben also das Tripel die alle die gleichen Grenzwerte darstellen .(0.05,1.645,μ+1.645σ)

Beachten Sie, dass für den t-Test dieselbe Entsprechung gilt, obwohl die Zahlen unterschiedlich sind. Der Test mit zwei Schwänzen hat ebenfalls eine ähnliche Entsprechung, jedoch mit unterschiedlichen Nummern.

Wahrscheinlichkeitslogik
quelle
Dank dafür! (und danke auch an die anderen Antwortenden).
Douglas S. Stones
8

Ein Wert beschreibt Ihre Abweichung vom Mittelwert in Einheiten der Standardabweichung. Es ist nicht explizit, ob Sie Ihre Nullhypothese akzeptieren oder ablehnen.Z

Ein Wert ist die Wahrscheinlichkeit, dass wir unter der Nullhypothese einen Punkt beobachten können, der so extrem ist wie Ihre Statistik. Dies sagt Ihnen explizit, ob Sie Ihre Nullhypothese bei einer Testgröße α ablehnen oder akzeptieren .pα

Betrachten Sie ein Beispiel, in dem und die Nullhypothese μ = 0 ist . Dann beobachten Sie x 1 = 5 . Ihr Z- Wert ist 5 (was Ihnen nur sagt, wie weit Sie von Ihrer Nullhypothese in Bezug auf σ abweichen ) und Ihr p- Wert ist 5,733e-7. Für ein 95% iges Vertrauen haben Sie eine Testgröße α = 0,05 und da p < α ist, lehnen Sie die Nullhypothese ab. Für jede gegebene Statistik sollte es jedoch ein Äquivalent A und gebenXN(μ,1)μ=0x1=5Zσpα=0.05p<αA so, dass die Tests gleich sind.B

Gary
quelle
3
@Gary - Ein p-Wert sagt dir nicht, dass du ablehnen sollst oder nicht mehr als einen Z-Score. Sie sind nur Zahlen. Nur die Entscheidungsregel bestimmt das Akzeptieren oder Ablehnen. Diese Entscheidungsregel könnte ebenso gut als Z-Score definiert werden (z. B. die oder 3 σ- Regel)2σ3σ
Wahrscheinlichkeitslogik
Zp
H0:μ=0HA:μ=1H05×107μ=1. Aber das ist absurd, niemand würde das tun, aber die p-Wert-Regel, die Sie hier verwenden, tut dies. Anders ausgedrückt, die von Ihnen beschriebene p-Wert-Regel ist nicht unveränderlich in Bezug auf die sogenannte "Nullhypothese" (Auflösung kommt)
Wahrscheinlichkeitslogik
Himp:μ=5HA1×109H0
Wahrscheinlichkeitslogik
1
H1:μ0H1P(X|μ1)
Wahrscheinlichkeit
6

pz

pzzp

Sheldon Cooper
quelle
Wenn die Stichprobengröße groß ist, ist die Standardabweichung klein, daher ist der Z-Score hoch. Ich denke, Sie können dies entdecken, wenn Sie ein numerisches Beispiel ausprobieren.
Wahrscheinlichkeitslogik
1
Nicht wirklich. Angenommen, Sie probieren aus N (0, 1). Dann ist Ihr Standard ungefähr 1, unabhängig von der Stichprobengröße. Was kleiner wird, ist der Standardfehler des Mittelwerts, nicht die Standardabweichung. p-Werte basieren auf SEM, nicht auf std.
SheldonCooper
Der Z-Score ist (beobachteter Mittelwert) / (Standardabweichung). Der Mittelwert und die Standardabweichung beziehen sich jedoch auf die beobachtete Statistik und nicht auf die Population, aus der Komponenten stammen. Meine lockere Terminologie wurde hier gefangen. Wenn Sie jedoch den Mittelwert testen, ist die entsprechende Standardabweichung im Z-Score der Standardfehler, der mit der gleichen Rate wie der p-Wert kleiner wird.
Wahrscheinlichkeitslogik