Ich lese in Larry Wassermans Buch All of Statistics und derzeit über p-Werte (Seite 187). Lassen Sie mich zunächst einige Definitionen einführen (ich zitiere):
Definition 1 Die Leistungsfunktion eines Tests mit Verwerfungsbereich ist definiert durch
Die Größe eines Tests definiert werden sollEin Test ist soll das Niveau wenn seine Größe kleiner oder gleich .
Dies besagt im Grunde, dass , die Größe die "größte" Wahrscheinlichkeit eines Fehlers vom Typ I ist. Der Wert wird dann definiert über (ich zitiere)
Definition 2 Angenommen, wir haben für jedes einen Test der Größe mit dem Ablehnungsbereich . Dann ist
wobei .
Für mich bedeutet dies: Bei einem bestimmten gibt es einen Test- und Zurückweisungsbereich so dass . Für den Wert nehme ich dann einfach den kleinsten von all diesen .
Frage 1 Wenn dies der Fall wäre, könnte ich eindeutig für beliebig kleine wählen . Was ist meine falsche Interpretation von Definition 2, dh was bedeutet das genau?
Nun setzt Wasserman fort und gibt einen Satz an, der eine "äquivalente" Definition des Wertes enthält, mit der ich vertraut bin (ich zitiere):
Satz Angenommen, der Test der Größe hat die Form H 0
Dann, wobei ist der beobachtete Wert von .
Hier ist meine zweite Frage:
Frage 2 Wie kann ich diesen Satz tatsächlich beweisen? Vielleicht liegt es an meinem Missverständnis der Definition des Werts, aber ich kann es nicht herausfinden.
quelle
Antworten:
Wir haben einige multivariate Daten , die aus einer Verteilung D mit einem unbekannten Parameter θ stammen . Beachten Sie, dass x Stichprobenergebnisse sind.x D θ x
Wir wollen eine Hypothese über einen unbekannten Parameter testen , die Werte von θ unter der Nullhypothese liegen in der Menge θ 0 .θ θ θ0
Im Raum des können wir einen Zurückweisungsbereich R definieren , und die Leistung dieses Bereichs R wird dann definiert als P R ˉ θ = P ˉ θ ( x ∈ R ) . So dass die Leistung wird berechnet für einen bestimmten Wert ˉ θ von θ als die Wahrscheinlichkeit , dass die Probe Ergebnis x in der Verwerfungsbereich ist R , wenn der Wert von θ ist ˉ θ . Offensichtlich hängt die Leistung von der Region R abX R R PRθ¯=Pθ¯(x∈R) θ¯ θ x R θ θ¯ R und auf dem gewählten .θ¯
Definition 1 definiert die Größe des BereichsR als das Supremum aller Werte von für ˉ θ in θ 0 , also nur für Werte von ˉ θ unter H 0 . Offensichtlich ist dies abhängig von der Region, so α R = s u p ˉ & thgr; ∈ & thgr; 0 P R ˉ & thgr; .PRθ¯ θ¯ θ0 θ¯ H0 αR=supθ¯∈θ0PRθ¯
Als abhängt R haben wir einen anderen Wert , wenn die Region ändert, und dies ist die Grundlage , um die p-Wert für die Definition: Änderung der Region, aber in einer Weise , dass die Probe noch beobachteten Wert in der Region gehört, für jede dieser Region, berechne das α R wie oben definiert und nimm das Infimum: p v ( x ) = i n f R | x ∈ R α R . Der p-Wert ist also die kleinste Größe aller Regionen, die x enthalten .αR R αR pv(x)=infR|x∈RαR x
Der Satz ist dann nur eine 'Übersetzung' davon, nämlich der Fall, in dem die Regionen unter Verwendung einer Statistik T definiert werden und für einen Wert c eine Region R als R = { x | definiert wird T ( x ) ≥ c } . Wenn Sie diese Art von Region R in der obigen Argumentation verwenden, folgt der Satz.R T c R R={x|T(x)≥c} R
BEARBEITEN wegen Kommentaren:
@ user8: für den Satz; Wenn Sie Ablehnungsbereiche wie im Satz definieren, ist ein Zurückweisungsbereich der Größe eine Menge, die wie folgt aussieht: R α = { X | T ( X ) ≥ c α } für einige c α .α Rα={X|T(X)≥cα} cα
Um den p-Wert eines beobachteten Wertes , dh p v ( x ) , müssen Sie den kleinsten Bereich R finden , dh den größten Wert von c, so dass { X | T ( X ) ≥ c } enthält immer noch x , letzteres (die Region enthält x ) entspricht (aufgrund der Art und Weise, wie die Regionen definiert sind) der Aussage, dass c ≥ T ( x ) ist , so dass Sie das größte c wie z dass { X | T.x pv(x) R c {X|T(X)≥c} x x c≥T(x) c {X|T(X)≥c&c≥T(x)}
Offensichtlich ist der größte , so dass c ≥ T ( x ) sollte sein c = T ( x ) und dann der Satz über wird { X | T ( X ) ≥ c = T ( x ) } = { X | T ( X ) ≥ T ( x ) }c c≥T(x) c=T(x) {X|T(X)≥c=T(x)}={X|T(X)≥T(x)}
quelle
In Definition 2 ist der Wert einer Teststatistik die größte Untergrenze von allen α, so dass die Hypothese für einen Test der Größe α verworfen wird . Denken Sie daran, dass je kleiner wir α machen, desto weniger Toleranz für Fehler vom Typ I wir zulassen, sodass auch der Zurückweisungsbereich R α abnimmt. (Sehr) informell gesehen ist der p- Wert das kleinste α, das wir wählen können, sodass wir H 0 für die beobachteten Daten immer noch ablehnen können. Wir können nicht willkürlich ein kleineres α wählen, weil irgendwann R αp α α α Rα p α H0 α Rα wird so klein sein, dass es das beobachtete Ereignis ausschließt (dh nicht enthält).
In Anbetracht des Vorstehenden lade ich Sie ein, den Satz zu überdenken.
quelle