(Um unsere Vorstellungen etwas präziser zu machen, nennen wir die 'Teststatistik' die Verteilung des Dings, nach dem wir suchen, um den p-Wert tatsächlich zu berechnen. Dies bedeutet, dass für einen zweiseitigen t-Test unsere Teststatistik wäre | T.| statt T. )
Was für eine Teststatistik tut ist eine Ordnung auf dem Probenraum induzieren (oder genauer, eine partielle Ordnung), so dass Sie die Extremfälle identifizieren (die , die am besten mit der Alternative).
Im Fall von Fisher's genauem Test gibt es in gewissem Sinne bereits eine Reihenfolge - das sind die Wahrscheinlichkeiten der verschiedenen 2x2-Tabellen selbst. Zufällig entsprechen sie der Reihenfolge auf X.1 , 1 in dem Sinne, dass entweder der größte oder der kleinste Wert von X.1 , 1 "extrem" sind und sie auch diejenigen mit der geringsten Wahrscheinlichkeit sind. Anstatt die Werte von X.1 , 1 zu betrachten, wie Sie es vorschlagen, können Sie einfach von den großen und kleinen Enden aus arbeiten und bei jedem Schritt nur den Wert hinzufügen (den größten oder den kleinsten X.1 , 1-Wert nicht bereits vorhanden) hat die geringste Wahrscheinlichkeit, die damit verbunden ist, bis Sie Ihren beobachteten Tisch erreichen; Bei seiner Aufnahme ist die Gesamtwahrscheinlichkeit all dieser extremen Tabellen der p-Wert.
Hier ist ein Beispiel:
> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
x prob rank
1 0 1.871194e-04 2
2 1 5.613581e-03 4
3 2 5.052223e-02 6
4 3 1.886163e-01 8
5 4 3.300786e-01 10
6 5 2.829245e-01 9
7 6 1.178852e-01 7
8 7 2.245433e-02 5
9 8 1.684074e-03 3
10 9 3.402171e-05 1
Die erste Spalte enthält X.1 , 1 Werte, die zweite Spalte enthält die Wahrscheinlichkeiten und die dritte Spalte enthält die induzierte Reihenfolge.
Im speziellen Fall des Fisher-Exact-Tests kann die Wahrscheinlichkeit jeder Tabelle (äquivalent zu jedem X.1 , 1 Wert) als tatsächliche Teststatistik betrachtet werden .
| X.1 , 1- μ |X.1 , 1
X.1 , 1
[Bearbeiten: Einige Programme präsentieren eine Teststatistik für den Fisher-Test. Ich würde annehmen, dass dies eine Berechnung vom Typ -2logL wäre, die asymptotisch mit einem Chi-Quadrat vergleichbar wäre. Einige mögen auch das Odds-Ratio oder sein Log präsentieren, aber das ist nicht ganz gleichwertig.]
quelle
Es hat nicht wirklich einen. Teststatistiken sind eine historische Anomalie - der einzige Grund, warum wir eine Teststatistik haben, besteht darin, einen p-Wert zu erreichen. Der genaue Test von Fisher springt an einer Teststatistik vorbei und geht direkt zu einem p-Wert über.
quelle