Verschiedene Hypothesentests, wie der GOF-Test, Kolmogorov-Smirnov, Anderson-Darling usw., folgen diesem Grundformat:
: Die Daten folgen der angegebenen Verteilung.
: Die Daten folgen nicht der angegebenen Verteilung.
Typischerweise bewertet man die Behauptung, dass einige gegebene Daten einer gegebenen Verteilung folgen, und wenn man ablehnt , sind die Daten auf einer gewissen Ebene nicht gut für die gegebene Verteilung geeignet .
Aber was ist, wenn wir nicht ablehnen ? Es wurde mir immer beigebracht, dass man nicht "akzeptieren" kann , weshalb wir keinen Beweis dafür , dass abgelehnt wird . Das heißt, es gibt keinen Hinweis darauf, dass wir ablehnen, dass die Daten der angegebenen Verteilung entsprechen.
Meine Frage ist also, was bringt es, solche Tests durchzuführen, wenn wir nicht schließen können, ob die Daten einer bestimmten Verteilung folgen oder nicht?
quelle
Antworten:
Allgemein gesagt (nicht nur in Bezug auf Passungstests, sondern auch in vielen anderen Situationen) können Sie nicht schlussfolgern, dass die Null richtig ist, da es Alternativen gibt, die bei jeder Stichprobengröße effektiv nicht von der Null zu unterscheiden sind.
Hier sind zwei Verteilungen, eine Standardnormale (grüne durchgezogene Linie) und eine ähnlich aussehende (90% Standardnormale und 10% standardisiertes Beta (2,2), gekennzeichnet mit einer roten gestrichelten Linie):
Der rote ist nicht normal. Bei haben wir nur eine geringe Chance, den Unterschied zu erkennen. Daher können wir nicht behaupten, dass Daten aus einer Normalverteilung stammen - was wäre, wenn sie stattdessen aus einer nicht normalen Verteilung wie der roten stammen?n = 100
Kleinere Bruchteile standardisierter Betas mit gleichen, aber größeren Parametern wären viel schwerer als normal zu sehen.
Da reale Daten jedoch so gut wie nie aus einer einfachen Verteilung stammen, würden wir bei einem perfekten Orakel (oder einer praktisch unendlichen Stichprobengröße) grundsätzlich immer die Hypothese ablehnen, dass die Daten aus einer einfachen Verteilungsform stammten.
Wie George Box es berühmt ausdrückte : " Alle Modelle sind falsch, aber einige sind nützlich. "
Betrachten Sie zum Beispiel das Testen der Normalität. Es kann sein, dass die Daten tatsächlich von einer normalen Quelle stammen, aber werden sie jemals genau normal sein? Sie werden es wahrscheinlich nie sein.
Das Beste, auf das Sie bei dieser Form des Testens hoffen können, ist die von Ihnen beschriebene Situation. (Siehe zum Beispiel den Beitrag Ist das Testen der Normalität im Wesentlichen nutzlos?, Aber es gibt hier eine Reihe anderer Beiträge, die verwandte Punkte hervorheben.)
Betrachten Sie das Bild oben noch einmal. Die Rotverteilung ist nicht normal und bei einer sehr großen Stichprobe könnten wir einen Normaltest ablehnen, der auf einer Stichprobe davon basiert ... aber bei einer viel kleineren Stichprobengröße, Regressionen und zwei Stichproben-T-Tests (und vielen anderen Tests) außerdem) wird sich so gut verhalten, dass es sinnlos ist, sich auch nur ein wenig über diese Nicht-Normalität Gedanken zu machen.
Möglicherweise können Sie einige bestimmte Formen der Abweichung angeben und sich so etwas wie Äquivalenztests ansehen, aber es ist schwierig, die Übereinstimmung zu überprüfen, da es so viele Möglichkeiten gibt, wie eine Verteilung nah an einer hypothetischen Verteilung liegt, sich jedoch von dieser unterscheidet Formen von Unterschieden können unterschiedliche Auswirkungen auf die Analyse haben. Wenn es sich bei der Alternative um eine breitere Familie handelt, die den Sonderfall Null enthält, sind Äquivalenztests sinnvoller (z. B. Exponentialtests gegen Gamma) - und tatsächlich führt dies der Ansatz des "zweiseitigen Tests" durch, und das könnte der Fall sein eine Möglichkeit zu sein, "nah genug" zu formalisieren (oder es wäre, wenn das Gammamodell wahr wäre, aber tatsächlich wäre es so gut wie sicher, dass es von einem gewöhnlichen Anpassungstest abgelehnt wird,
Das Testen der Anpassungsgüte (und häufig auch das Testen von Hypothesen) eignet sich nur für einen relativ begrenzten Bereich von Situationen. Die Frage, die die Leute normalerweise beantworten möchten, ist nicht so präzise, aber etwas vager und schwieriger zu beantworten - aber wie John Tukey sagte: " Weitaus besser eine ungefähre Antwort auf die richtige Frage, die oft vage ist, als eine genaue Antwort auf die Frage falsche Frage, die immer präzisiert werden kann. "
Angemessene Ansätze zur Beantwortung der vage- ren Frage können Simulations- und Resampling-Untersuchungen umfassen, um die Sensitivität der gewünschten Analyse für die von Ihnen in Betracht gezogene Annahme im Vergleich zu anderen Situationen zu bewerten, die ebenfalls mit den verfügbaren Daten einigermaßen konsistent sind.
quelle
quelle
Eine Ansicht, die meines Erachtens von den meisten Menschen geteilt wird, ist, dass das Testen von Hypothesen eine probabilistische Anpassung des Fälschungsprinzips ist .
quelle
Ich denke, dies ist ein perfektes Beispiel, um den Unterschied zwischen akademischer Arbeit und praktischer Entscheidungsfindung zu veranschaulichen. Im akademischen Umfeld (wo ich bin) können Sie nach Belieben argumentieren, solange dies von anderen als angemessen erachtet wird. Im Grunde genommen haben wir also endlose, manchmal kreisförmige, argige Schwierigkeiten miteinander. In diesem Sinne bietet dies den Menschen etwas, an dem sie arbeiten können.
Wenn Sie jedoch tatsächlich in der Lage sind, Entscheidungen zu treffen, lautet die Antwort definitiv Ja oder Nein. Unentschlossenheit schadet Ihrem Ruf als Entscheidungsträger. Natürlich beinhaltet die Auswahl nicht nur Statistiken, sondern manchmal auch ein Element des Glücksspiels und des Vertrauenssprungs. Zusammenfassend ist diese Art von Übung in gewissem Maße nützlich für die Entscheidungsfindung. Ganz anders sieht es jedoch aus, ob Sie sich bei Ihrer Entscheidung ausschließlich auf diesen Hypothesentest verlassen.
quelle
Der Punkt ist, dass Sie aus rein statistischer Sicht nicht akzeptieren können , aber in der Praxis. Wenn Sie beispielsweise das Risiko eines Portfolios mithilfe von Value-at-Risk- Maßnahmen oder ähnlichen Maßnahmen schätzen , ist die Verteilung der Portfoliorendite sehr wichtig. Dies liegt daran, dass das Risiko durch das Ende Ihrer Verteilung definiert wird.
In Schulbuchfällen wird häufig die Normalverteilung als Beispiel verwendet. Wenn Ihre Portfoliorenditen jedoch Fettschwänze aufweisen (was häufig der Fall ist), werden die Risiken durch die Normalverteilungsannäherung unterschätzt. Daher ist es wichtig, die Renditen zu untersuchen und zu entscheiden, ob Sie die normale Annäherung verwenden oder nicht. Beachten Sie, dass dies nicht unbedingt das Ausführen statistischer Tests bedeutet. Es kann sich um QQ-Diagramme oder andere Mittel handeln. Sie müssen jedoch irgendwann eine Entscheidung treffen, die auf der Analyse der Renditen und Ihrer Renditemodelle basiert, und entweder normal verwenden oder nicht.
Nicht ablehnen heißt also für alle praktischen Zwecke wirklich akzeptieren, wenn auch nicht im rein statistischen Sinne. Sie gehen zu den normalen und verwenden Sie es in Ihren Berechnungen zu akzeptieren, die täglich mit dem oberen Management angezeigt wird, auf Ihre Aufsichtsbehörden, Wirtschaftsprüfer etc. nicht ablehnen in diesem Fall hat Konsequenzen in jeder Hinsicht weitreichend, so dass es wie oder mächtiger als das alberne statistische Ergebnis.
quelle
Kein Angeklagter vor Gericht ist jemals unschuldig. Sie sind entweder schuldig (lehnen die Nullhypothese der Unschuld ab) oder nicht schuldig (lehnen die Unschuldsvermutung nicht ab).
Das Fehlen von Beweisen ist kein Beweis für das Fehlen.
quelle
Wenn Sie eine alternative Distribution (oder eine Reihe von Distributionen) im Auge haben, mit der Sie vergleichen können, kann dies ein nützliches Werkzeug sein.
Einige Interpretationsschwierigkeiten bei der Anwendung des Chi-Quadrat-Tests. Joseph Berkson. Zeitschrift der American Statistical Association. Vol. 33, Nr. 203 (Sep. 1938), S. 526-536
quelle