Abgesehen von dem offensichtlichen Problem der geringen Leistung des Chi-Quadrats unter diesen Umständen, stellen Sie sich vor, Sie führen einen Chi-Quadrat-Test für eine bestimmte Dichte mit nicht festgelegten Parametern durch, indem Sie die Daten bündeln.
Nehmen wir der Vollständigkeit halber eine Exponentialverteilung mit unbekanntem Mittelwert und einer Stichprobengröße von beispielsweise 100 an.
Um eine vernünftige Anzahl von erwarteten Beobachtungen pro Bin zu erhalten, müssten einige Daten berücksichtigt werden (wenn wir beispielsweise 6 Bins unter den Mittelwert und 4 darüber setzen, werden immer noch datenbasierte Bin-Grenzen verwendet). .
Diese Verwendung von Behältern basierend auf dem Anzeigen der Daten würde sich jedoch vermutlich auf die Verteilung der Teststatistik unter der Null auswirken.
Ich habe viel Diskussion über die Tatsache gesehen , dass - wenn die Parameter von Maximum - Likelihood von den geschätzten werden binned Daten - Sie 1 df pro geschätzten Parameter verlieren (ein Problem nach rechts zurück zu Fisher vs Karl Pearson Datierung) - aber ich weiß nicht mehr , Lesen Sie alles über das Finden der Bin-Grenzen anhand der Daten. (Wenn Sie sie aus den nicht eingeteilten Daten abschätzen, liegt bei Bins die Verteilung der Teststatistik irgendwo zwischen a und a .)
Hat diese datenbasierte Auswahl von Behältern einen wesentlichen Einfluss auf das Signifikanzniveau oder die Leistung? Gibt es Ansätze, die wichtiger sind als andere? Wenn es einen großen Effekt gibt, ist es etwas, das in großen Samples verschwindet?
Wenn es einen wesentlichen Einfluss hat, scheint dies die Verwendung eines Chi-Quadrat-Tests zu erschweren, wenn Parameter unbekannt sind, die in vielen Fällen fast unbrauchbar sind (obwohl sie in einigen Texten immer noch empfohlen werden), es sei denn, Sie hatten ein gutes a -priori Schätzung des Parameters.
Eine Diskussion der Themen oder Hinweise auf Verweise (vorzugsweise unter Erwähnung ihrer Schlussfolgerungen) wäre nützlich.
Bearbeiten, so ziemlich abgesehen von der Hauptfrage:
Es fällt mir ein, dass es für den speziellen Fall des Exponentials * (und der Uniform) mögliche Lösungen gibt, aber ich bin immer noch an der allgemeineren Frage der Auswirkung bei der Auswahl der Behältergrenzen interessiert.
* Für das Exponential könnte man zum Beispiel die kleinste Beobachtung verwenden (sagen wir, sie ist gleich ), um eine sehr grobe Vorstellung davon zu bekommen, wo die Fächer zu platzieren sind (da die kleinste Beobachtung mit dem Mittelwert exponentiell ist ), und Testen Sie dann die verbleibenden Differenzen ( ) auf Exponentialität. Dies könnte natürlich zu einer sehr schlechten Schätzung von und damit zu einer schlechten Auswahl von Behältern führen, obwohl man das Argument vermutlich rekursiv verwenden könnte, um die niedrigsten zwei oder drei Beobachtungen zu treffen, aus denen man vernünftige Behältern auswählen und dann die Unterschiede von testen kann die übrigen Beobachtungen über der größten dieser Statistiken kleinster Ordnung für Exponentialität)μ / n n - 1 × i - m μ
quelle
Antworten:
Die grundlegenden Ergebnisse der Chi-Quadrat-Anpassungstests können hierarchisch verstanden werden .
Stufe 0 . Die klassische Pearson-Chi-Quadrat-Teststatistik zum Testen einer multinomialen Stichprobe gegen einen Vektor mit fester Wahrscheinlichkeit ist X 2 ( p ) = k ∑ i = 1 ( X ( n ) i - n p i ) 2p
Wobei X ( n ) , i bezeichnet die Anzahl der Ergebnisse in der i - ten Zelle aus einer Probeeiner Größe n . Dies kann fruchtbar als die quadratische Norm des Vektors Y n = ( Y ( n ) 1 , … , Y ( n ) k ) angesehen werden, wobei Y ( n ) i = ( X ( n ) i - n p i ) / √
Beispiele sind die Rao-Robson-Nikulin-Statistik und die Dzhaparidze-Nikulin-Statistik .
Verweise
A W. van der Vaart (1998), Asymptotic Statistics , Cambridge University Press. Kapitel 17 : Chi-Quadrat-Tests .
FC Drost (1989), Verallgemeinerte Chi-Quadrat-Anpassungstests für Modelle im Ortsmaßstab , wenn die Anzahl der Klassen gegen unendlich tendiert , Ann. Stat . Vol. 17, nein. 3, 1285–1300.
MS Nikulin, MS (1973), Chi-Quadrat-Test für die kontinuierliche Verteilung mit Verschiebungs- und Skalenparametern , Theory of Probability and its Application , vol. 19, nein. 3, 559–568.
KO Dzaparidze und MS Nikulin (1973), Über eine Modifikation der Standardstatistik von Pearson , Theory of Probability and its Application , vol. 19, nein. 4, 851–853.
KC Rao und DS Robson (1974), Eine Chi-Quadrat-Statistik für die Güte von Fit-Tests innerhalb der Exponentialfamilie , Comm. Statist. Vol 3, No. 12, 1139–1153.
N. Balakrishnan, V. Voinov und MS Nikulin (2013), Chi-Quadrat- Prüfung der Anpassungsgüte mit Anwendungen , Academic Press.
quelle
Ich habe unten zumindest teilweise Antworten auf meine Frage gefunden. (Ich möchte trotzdem jemandem diesen Bonus geben, daher sind alle weiteren Informationen willkommen.)
Verweise
Moore DS (1971), Eine Chi-Quadrat-Statistik mit zufälligen Zellgrenzen , Ann. Mathematik. Stat. Bd. 42, Nr. 1, 147–156.
Roy AR (1956), Onχ2 Statistik mit variablen Intervallen ,
Technischer Bericht Nr. 1 , Department of Statistics, Stanford University.
Watson, GS (1957), Theχ2 Anpassungstest für Normalverteilungen , Biometrika , 44 , 336–348.
Watson, GS (1958), Onχ2 Anpassungstests für kontinuierliche Verteilungen , J. Royal Statist. Soc. B , 20 , 44–61.
Watson, GS (1959), Einige neuere Ergebnisse inχ2 Anpassungstests , Biometrics , 15 , 440-468
quelle