Artikel zur Durchführung von Hypothesentests basierend auf dem Ergebnis eines anderen Tests

11

Es ist bekannt, dass es problematisch ist, einen statistischen Test basierend auf dem Ergebnis eines anderen statistischen Tests zu wählen, da die p-Werte schwer bis unmöglich zu interpretieren sind (z. B. Auswahl eines statistischen Tests basierend auf dem Ergebnis eines anderen (z. B. Normalität) ). . Dies ist jedoch in vielen Anwendungen immer noch Standard und scheint in angewandten Arbeiten normalerweise nicht bemerkt oder diskutiert zu werden. Beim Durchblättern der Literatur konnte ich kein Papier finden, das dieses Phänomen tatsächlich diskutiert.

Ich würde mich über Links zu Veröffentlichungen freuen, die sich auf die Auswahl eines statistischen Tests auf der Grundlage des Ergebnisses eines anderen statistischen Tests beziehen, insbesondere zu Veröffentlichungen, die angewandten Wissenschaftlern zugänglich sind.

Rob Hall
quelle
Unabhängiger Kommentar: Bei meiner Suche stieß ich auf einen Artikel von RS Nickerson über das Testen der Nullhypothesen-Signifikanz: eine Überprüfung einer alten und anhaltenden Kontroverse , in dem dieses spezielle Phänomen nicht diskutiert wird, der aber auch angewandten Wissenschaftlern als angenehm erscheint.
Rob Hall
2
Vor langer Zeit habe ich eine detaillierte Analyse einer solchen Situation unter quantdec.com/envstats/notes/class_12/ucl.htm veröffentlicht : Sie untersucht die Eigenschaften einer UCL, die durch ein Verfahren bestimmt wird, das von den Ergebnissen eines vorläufigen Hypothesentests abhängig gemacht wird ( bezüglich der zugrunde liegenden Verteilung).
whuber
3
Dieses könnte Sie interessieren (siehe auch diese ). Dann gibt es diese . Dies bezieht sich auf das Testen der Varianzgleichheit bzw. der Normalität vor einem T-Test mit zwei Stichproben.
Glen_b -State Monica
Es scheint mir, dass einfach zu sagen, dass "es bekannt ist, dass es problematisch ist", eine unzureichende Spezifität bietet, da die Problematik wahrscheinlich von dem statistischen Rahmen abhängt, in dem man arbeitet. Probleme bei der häufig auftretenden Interpretation sind möglicherweise keine Probleme bei Methoden, mit denen die Beweisbedeutung von Daten bewertet wird.
Michael Lew
Vielleicht würde ein einfaches Beispiel, bei dem dies problematisch ist, dem gleichen Zweck dienen wie ein Zitat.
BKay

Antworten:

1

Ich denke, dass das folgende Forschungspapier zu Kettenverfahren für die Beantwortung Ihrer Frage relevant und hilfreich sein könnte: http://www.multxpert.com/doc/md2011.pdf .

Aleksandr Blekh
quelle
1
Vielen Dank für das interessante Papier. Wenn ich es richtig verstehe, geht es um die datengesteuerte Zuordnung von Alpha zu einem geordneten Satz von Hypothesen. Ein solches Verfahren könnte dann einfach alle Varianten einer Hypothese zu einer Liste hinzufügen (z. B. die Hypothese, dass ein paremetrischer Test verwendet werden kann, und die Hypothese, dass es einige Hinweise dafür gibt, dass ein nicht-paremetrischer Test verwendet werden sollte). Während dies in einem Neyman-Pearson-Framework ein vernünftiger Ansatz sein sollte, bin ich mir nicht sicher, ob dies das Problem der Interpretation der p-Werte im Sinne von Fisher löst.
Rob Hall
1
@RobHall: Gern geschehen! Ehrlich gesagt habe ich die Zeitung durchgesehen, ohne mich mit Details zu befassen, daher kann ich derzeit keinen wirklich lohnenden Kommentar abgeben. Aber ich hoffe, dass ich dieses Papier überprüfen kann, wenn ich eine Chance habe. Übrigens, hier ist ein weiteres interessantes Papier, das hierfür relevant sein könnte, wo der Autor argumentiert, dass die beiden Frameworks als komplementär angesehen werden können: stat.duke.edu/courses/Spring07/sta215/Ref/Lehm1993.pdf .
Aleksandr Blekh