Was ist die Teststatistik in Fisher's genauem Test?

9

Für eine 2 × 2-Kontingenztabelle verwenden einige der genauen Fisher-Tests die Anzahl in der (1,1) -Zelle in der Tabelle als Teststatistik, und unter der Nullhypothese hat X 1 , 1 eine hypergeometrische Verteilung .X.1,1X.1,1

Einige sagten, seine Teststatistik sei Dabei ist μ der Mittelwert der hypergeometrischen Verteilung (oben erwähnt) unter Null. Es wurde auch gesagt, dass p-Werte basierend auf der Tabelle der hypergometrischen Verteilung bestimmt werden. Ich habe mich gefragt, ob es einen Grund gibt, den Mittelwert zu subtrahieren und dann den absoluten Wert anzunehmen. | X 1 , 1 - μ | hat keine hypergeometrische Verteilung unter Null, oder?

|X.1,1- -μ|
μ|X.1,1- -μ|
Tim
quelle

Antworten:

10

(Um unsere Vorstellungen etwas präziser zu machen, nennen wir die 'Teststatistik' die Verteilung des Dings, nach dem wir suchen, um den p-Wert tatsächlich zu berechnen. Dies bedeutet, dass für einen zweiseitigen t-Test unsere Teststatistik wäre |T.| statt T. )

Was für eine Teststatistik tut ist eine Ordnung auf dem Probenraum induzieren (oder genauer, eine partielle Ordnung), so dass Sie die Extremfälle identifizieren (die , die am besten mit der Alternative).

Im Fall von Fisher's genauem Test gibt es in gewissem Sinne bereits eine Reihenfolge - das sind die Wahrscheinlichkeiten der verschiedenen 2x2-Tabellen selbst. Zufällig entsprechen sie der Reihenfolge auf X.1,1 in dem Sinne, dass entweder der größte oder der kleinste Wert von X.1,1 "extrem" sind und sie auch diejenigen mit der geringsten Wahrscheinlichkeit sind. Anstatt die Werte von X.1,1 zu betrachten, wie Sie es vorschlagen, können Sie einfach von den großen und kleinen Enden aus arbeiten und bei jedem Schritt nur den Wert hinzufügen (den größten oder den kleinsten X.1,1-Wert nicht bereits vorhanden) hat die geringste Wahrscheinlichkeit, die damit verbunden ist, bis Sie Ihren beobachteten Tisch erreichen; Bei seiner Aufnahme ist die Gesamtwahrscheinlichkeit all dieser extremen Tabellen der p-Wert.

Hier ist ein Beispiel:

hypergeometrische Wahrscheinlichkeitsfunktion

> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
   x         prob rank
1  0 1.871194e-04    2
2  1 5.613581e-03    4
3  2 5.052223e-02    6
4  3 1.886163e-01    8
5  4 3.300786e-01   10
6  5 2.829245e-01    9
7  6 1.178852e-01    7
8  7 2.245433e-02    5
9  8 1.684074e-03    3
10 9 3.402171e-05    1

Die erste Spalte enthält X.1,1 Werte, die zweite Spalte enthält die Wahrscheinlichkeiten und die dritte Spalte enthält die induzierte Reihenfolge.

Im speziellen Fall des Fisher-Exact-Tests kann die Wahrscheinlichkeit jeder Tabelle (äquivalent zu jedem X.1,1 Wert) als tatsächliche Teststatistik betrachtet werden .

|X.1,1- -μ|X.1,1

X.1,1

[Bearbeiten: Einige Programme präsentieren eine Teststatistik für den Fisher-Test. Ich würde annehmen, dass dies eine Berechnung vom Typ -2logL wäre, die asymptotisch mit einem Chi-Quadrat vergleichbar wäre. Einige mögen auch das Odds-Ratio oder sein Log präsentieren, aber das ist nicht ganz gleichwertig.]

Glen_b - Monica neu starten
quelle
X.1,1μ|X.1,1- -μ|
Es scheint eine äußerst vernünftige Teststatistik zu sein, da sie vollständig interpretierbar und leicht verständlich ist. In der Tat wird keine der möglichen Statistiken eine symmetrische Verteilung haben. Vergessen wir für einen Moment die Besonderheiten des Fisher-Tests. Wenn diese Statistik für Sie von Bedeutung ist, können Sie auf dieser Grundlage einen genauen Test berechnen (mithilfe hypergeometrischer Berechnungen, um die Wahrscheinlichkeiten zu ermitteln). Wenn Sie zeigen möchten, dass sie in allen Fällen die gleiche Reihenfolge induzieren, ist dies wahrscheinlich eine neue Frage.
Glen_b -Rate State Monica
6

|X.1,1- -μ|μ|X.1,1- -μ|X.1,1

X.1,1kW.B.X.1,1B.W.k

gui11aume
quelle
4

Es hat nicht wirklich einen. Teststatistiken sind eine historische Anomalie - der einzige Grund, warum wir eine Teststatistik haben, besteht darin, einen p-Wert zu erreichen. Der genaue Test von Fisher springt an einer Teststatistik vorbei und geht direkt zu einem p-Wert über.

Jeremy Miles
quelle
Danke, aber gibt es wirklich keine Teststatistik? Wie bestimmen Sie dann den p-Wert?
Tim
Das Ergebnis des exakten Fisher-Tests ist der p-Wert.
Jeremy Miles
@JeremyMiles: Meinen Sie, dass Teststatistiken historische Anomalien sind, da Benutzer vor der kostengünstigen Berechnung Z, t usw. berechnet und diese Teststatistik dann mit den vorberechneten Tabellen verglichen haben, um die statistische Signifikanz zu bestimmen. Viele aktuelle Benutzer von Inferenzstatistiken denken immer noch an Teststatistiken, wenn sie genauso gut einen p-Wert liefern könnten. Mit anderen Worten, ist dies eine Art Generationeneffekt?
Rabidotter
1
@ Rabidotter - ja, ich denke schon. Sie sehen Leute, die schreiben "F = 14.352, df = 2, 568, p <0.05". Der einzige Grund, warum sich jemand für F interessiert, ist die Berechnung von P, aber sie geben F mit massiver Präzision und p mit sehr geringer Präzision.
Jeremy Miles