Wenn Sie einige Null- oder Alternativhypothesen mit einer Teststatistik testen , wobei , wenden Sie den Permutationstest mit der Menge der Permutationen auf und wir haben eine neue Statistik X = { x i , . . . , x n } G X T ( X ) : = # { π ∈ G : U ( π X ) ≥ U ( X ) }
Was ist der Vorteil der Verwendung des Permutationstests gegenüber der Nichtverwendung? Dh wie ist es, wenn der Permutationstest funktioniert?
Welche Bedingungen, um dies zu erreichen? Wie einige Bedingungen auf der Teststatistik und / oder auf der Nullhypothese?
Beispielsweise,
Sollte für Probe gleich dem p-Wert basierend auf ? Wenn ja, warum? (Referenzen werden auch geschätzt)U ( X ) X.
Der p-Wert von ist definiert als . Wenn der Permutationstest die Permutationsverteilung von U (X) | schätzen soll X = x , wie ist T (X) gleich dem p-Wert von U (X) bei X = x ? Insbesondere kann es mehr als eine Verteilung im Null- H geben , und T (X) berücksichtigt die Null-Verteilungen nicht einzeln und nimmt dann \ sup_ {F \ in H} und \ inf_ {c: U (x) \ geq c} .inf c ≤ R : U ( x ) ≥ c sup F ≤ H P ( U ( X ) ≥ c | X ≤ F ) U ( X ) | X = x T ( X ) U ( X ) X = x H T ( X ) sup F ∈ H.
Sollte der Permutationstest über die Nullhypothesen verteilungsfrei machen ? Unter welchen Bedingungen wird das geschehen?
Sollte gleichmäßig über ? Unter welchen Bedingungen wird das geschehen? Beachten Sie, dass, wenn eine konstante Funktion ist, auch bei konstant ist und die Verteilung von weit davon entfernt ist, über gleichmäßig zu sein .[ 0 , 1 ] U ( ⋅ ) T ( ⋅ ) 1 T ( X ) [ 0 , 1 ]
Danke und Grüße!
Antworten:
Da die Diskussion lang wurde, habe ich meine Antworten auf eine Antwort genommen. Aber ich habe die Reihenfolge geändert.
Permutationstests sind eher "genau" als asymptotisch (vergleiche beispielsweise mit Likelihood-Ratio-Tests). So können Sie beispielsweise einen Mittelwerttest durchführen, ohne die Verteilung der Mittelwertdifferenz unter der Null berechnen zu können. Sie müssen nicht einmal die beteiligten Verteilungen angeben. Sie können eine Teststatistik entwerfen, die unter einer Reihe von Annahmen eine gute Leistung aufweist, ohne für diese so empfindlich zu sein wie eine vollständig parametrische Annahme (Sie können eine Statistik verwenden, die robust ist, aber eine gute ARE aufweist).
Beachten Sie, dass die Definitionen, die Sie geben (oder besser gesagt, wer auch immer Sie dort zitieren), nicht universell sind. Einige Leute würden U eine Permutationsteststatistik nennen (was einen Permutationstest ausmacht, ist nicht die Statistik, sondern wie Sie den p-Wert bewerten). Aber wenn Sie einen Permutationstest durchführen und eine Richtung zugewiesen haben, da "Extreme davon nicht mit H0 übereinstimmen", ist diese Art der Definition für T oben im Grunde, wie Sie p-Werte berechnen - es ist nur der tatsächliche Anteil der Permutationsverteilung mindestens so extrem wie die Stichprobe unter der Null (genau die Definition eines p-Wertes).
Wenn ich zum Beispiel einen (der Einfachheit halber einseitigen) Mittelwerttest wie einen T-Test mit zwei Stichproben durchführen möchte, könnte ich meine Statistik zum Zähler der T-Statistik oder zur T-Statistik selbst machen. oder die Summe der ersten Probe (jede dieser Definitionen ist in den anderen monoton, abhängig von der kombinierten Probe) oder einer monotonen Transformation von ihnen und haben den gleichen Test, da sie identische p-Werte ergeben. Alles, was ich tun muss, ist zu sehen, wie weit (in Bezug auf die Proportionen) die Permutationsverteilung der Statistik reicht, für die ich die Stichprobenstatistik wähle. T wie oben definiert ist nur eine andere Statistik, so gut wie jede andere, die ich wählen könnte (T wie definiert, da es in U monoton ist).
T wird nicht genau gleichförmig sein, da dies kontinuierliche Verteilungen erfordern würde und T notwendigerweise diskret ist. Da U und damit T einer bestimmten Statistik mehr als eine Permutation zuordnen können, sind die Ergebnisse nicht gleich wahrscheinlich, aber sie haben ein "einheitliches" cdf **, aber eines, bei dem die Schritte nicht unbedingt gleich groß sind .
** ( und genau gleich an der rechten Grenze jedes Sprungs - es gibt wahrscheinlich einen Namen für das, was das eigentlich ist)F(x)≤x
Für vernünftige Statistiken, wenn gegen unendlich geht, nähert sich die Verteilung von Gleichförmigkeit. Ich denke, der beste Weg, sie zu verstehen, besteht darin, sie in verschiedenen Situationen zu tun.n T
T ist der p-Wert (für Fälle, in denen großes U eine Abweichung von der Null anzeigt und kleines U damit übereinstimmt). Beachten Sie, dass die Verteilung von der Stichprobe abhängig ist. Die Verteilung ist also nicht "für irgendeine Probe".
Ich habe bereits erklärt, dass T nicht einheitlich ist.
Ich glaube, ich habe bereits erklärt, was ich als die Vorteile von Permutationstests sehe. andere Leute schlagen andere Vorteile vor ( z . B. ).
Der von Ihnen zitierte Satz besagt ausdrücklich, dass T ein p-Wert ist und wann. Wenn Sie erklären können, was daran unklar ist, könnte ich vielleicht mehr sagen. Was den Grund betrifft, siehe die Definition des p-Werts (erster Satz unter dem Link) - daraus folgt ganz direkt
Es gibt eine gute elementare Diskussion Permutationstests hier .
- -
Bearbeiten: Ich füge hier ein kleines Permutationstestbeispiel hinzu; Dieser (R) Code ist nur für kleine Stichproben geeignet. Sie benötigen bessere Algorithmen, um die extremen Kombinationen in moderaten Stichproben zu finden.
Betrachten Sie einen Permutationstest gegen eine einseitige Alternative:
* aber ich vermeide es normalerweise, weil es das Problem für Schüler besonders verwirrt, wenn sie versuchen, Nullverteilungen zu erarbeiten
zu folgenden Daten:
Es gibt 35 Möglichkeiten, die 7 Beobachtungen in Stichproben der Größen 3 und 4 zu unterteilen:
Wie bereits erwähnt, ist angesichts der 7 Datenwerte die Summe der ersten Stichprobe in der Mittelwertdifferenz monoton. Verwenden wir diese also als Teststatistik. Die Originalprobe hat also eine Teststatistik von:
Hier ist die Permutationsverteilung:
(Es ist nicht unbedingt erforderlich, sie zu sortieren. Ich habe das nur getan, um leichter zu erkennen, dass die Teststatistik der zweite Wert am Ende war.)
Wir können sehen (in diesem Fall durch Inspektion), dass 2/35 ist, oderp
(Beachten Sie, dass nur im Fall ohne xy-Überlappung ein p-Wert unter 0,05 hier möglich ist. In diesem Fall wäre diskret einheitlich, da es in keine gebundenen Werte gibt .)T U
Die rosa Pfeile geben die Stichprobenstatistik auf der x-Achse und den p-Wert auf der y-Achse an.
quelle