Hintergrund
In der Informatik, Mathematik und manchmal auch in anderen Bereichen können „esoterische“ Beispiele nicht nur unterhaltsam, sondern auch hilfreich sein, um bestimmte Konzepte zu veranschaulichen, zum Beispiel:
Bogosort und Slowsort sind sehr ineffiziente Sortieralgorithmen, mit denen die Eigenschaften von Algorithmen verstanden werden können, insbesondere im Vergleich zu anderen Sortieralgorithmen.
Esoterische Programmiersprachen zeigen, wie weitreichend das Konzept einer Programmiersprache ist, und helfen, gute Programmiersprachen zu schätzen.
Die Weierstraß-Funktion und die Dirichlet-Funktion werden hauptsächlich verwendet, um bestimmte Missverständnisse über das Konzept der Kontinuität zu veranschaulichen.
Ich bereite derzeit einige Lehren zur Verwendung von Hypothesentests vor und denke, dass ein Test mit sehr geringer Leistung (aber ohne andere Mängel) das Konzept der statistischen Leistung veranschaulichen würde. (Natürlich muss ich mich immer noch selbst entscheiden, ob ein bestimmtes Beispiel für mein Publikum didaktisch nützlich oder nur verwirrend ist.)
Aktuelle Frage
Gibt es statistische Tests mit absichtlich geringer Leistung, genauer gesagt:
- Der Test passt in den allgemeinen Rahmen von Hypothesentests, dh er arbeitet mit einer Nullhypothese, hat Anforderungen und gibt einen (korrekten) p- Wert zurück.
- Es ist nicht für ernsthafte Anwendungen vorgesehen.
- Es hat eine sehr geringe Leistung (aufgrund eines absichtlichen Designfehlers und nicht aufgrund einer geringen Sample- oder Effektgröße).
Wenn Sie grundsätzlich argumentieren können, dass ein solcher Test nicht existieren kann, würde ich dies auch als gültige Antwort auf meine Frage betrachten. Wenn andererseits eine Vielzahl solcher Tests vorhanden ist, bin ich an dem didaktisch effizientesten interessiert, dh er sollte leicht zugänglich sein und eine bemerkenswerte Wirkung haben.
Beachten Sie, dass ich nicht nach einer allgemeinen Auswahl statistischer Fehler (Kirschernte usw.) oder ähnlichem frage.
Was ich bisher gefunden habe
Internetrecherchen haben mir nichts gebracht.
Jeder Versuch, so etwas zu konstruieren, endete entweder in einem (nützlichen) vorhandenen Test oder das Format ist nicht das eines regulären Tests. Ich habe zum Beispiel über einen Test nachgedacht, ob eine Population einen positiven Median hat, der nur dann Ja zurückgibt, wenn alle Stichproben positiv sind. Dieser Test gibt jedoch keinen p- Wert zurück und passt daher nicht in den üblichen Testrahmen. Wenn ich nur die positiven und negativen Vorzeichen als Teststatistik zähle (und die p- Werte entsprechend berechne ), erhalte ich den Vorzeichentest , der ein vernünftiger Test ist.
quelle
Antworten:
Es gibt eine kleine Bemerkung zum Neyman-Pearson-Lemma (Beweis in Geisser (2006), Modi der parametrischen statistischen Inferenz , Kapitel 4.4):Eϕ(X)=α
ϕ(x)={0 1 when f0(x)<kf1(x)when f0(x)>kf1(x)
das am wenigsten leistungsfähige Niveau α Test ϕ der Nullhypothese H0: Dichte f0 gegen H1: Dichte f1 aus Daten x .
Aus diesem Ergebnis können Sie einheitlich am wenigsten leistungsfähige, lokal am wenigsten leistungsfähige, gleichmäßig am wenigsten leistungsfähige ähnliche und am wenigsten leistungsfähige "vollständig voreingenommene" Tests ableiten (ich meine diejenigen mit geringerer Leistung unter jeder Alternative als unter der Null). Wenn Sie bereits eine einheitlich mächtigste haben, & c. Test, multiplizieren Sie einfach Ihre Teststatistik mit -1, um die Partitionierung des induzierten Probenraums beizubehalten und gleichzeitig die Reihenfolge der Partitionen umzukehren.
Vielleicht könnte, wie @ user54038 vorschlägt, das "Versagen einer allgemeinen Methode zur Testkonstruktion" interessanter sein. Lehmann (1950), "Einige Prinzipien der Theorie der Prüfung statistischer Hypothesen", Ann. Mathematik. Statist. , 21 , 1 schreibt Stein das folgende Beispiel zu:
Beachten Sie, dass es sich um den verallgemeinerten Wahrscheinlichkeitstest handelt, den er in Betracht zieht, wobeip die Rolle eines zu maximierenden Störparameters spielt. Also , wenn X=−2 oder X=2 , p = 1 oder p = 0 bzw. & das Likelihood - Verhältnis kommt zu 2 Cp^=1 p^=0 2Cα in jedem Fall; für jeden anderen Wert vonX es der niedrigere Wert von1−C1−α .
quelle
(Bezogen auf den Kommentar von @Scortchi)
Angenommen,X∼N(μ,1) und wir wollen die Hypothese testen
Aus Gründen der esetoricism, mal erweitern unsere Daten mit einer unabhängigen "coin flip"Z∼Bernoulli(p) , wobei p bekannt ist , und nicht kleiner als das Signifikanzniveau α (dh p∈[α,1] ). Betrachten Sie Ablehnungsbereiche des Formulars:
Konstruktionsbedingt ist dies ein gültiger Test der Größeα .
quelle