Ich führe einen GOF-Test (Chi-Square Goodness of Fit) mit drei Kategorien durch und möchte speziell die Null testen, bei der die Bevölkerungsanteile in jeder Kategorie gleich sind (dh der Anteil beträgt 1/3 in jeder Gruppe):
BEOBACHTETE DATEN
Gruppe 1 Gruppe 2 Gruppe 3 Gesamt
686 928 1012 2626
Für diesen GOF-Test sind also 2626 (1/3) = 875,333 zu erwarten, und der Test ergibt einen hochsignifikanten p- Wert von <0,0001.
Nun ist es offensichtlich, dass Gruppe 1 sich signifikant von 2 und 3 unterscheidet, und es ist unwahrscheinlich, dass sich 2 und 3 signifikant unterscheiden. Wenn ich all dies jedoch formal testen und in der Lage sein würde, einen p- Wert für jeden Fall bereitzustellen , welche Methode wäre die richtige?
Ich habe überall online gesucht und es scheint, dass es unterschiedliche Meinungen gibt, aber ohne formale Dokumentation. Ich frage mich, ob es einen Text oder ein begutachtetes Papier gibt, das dies anspricht.
Was mir angesichts des signifikanten Gesamttests vernünftig erscheint, ist, z- Tests für die Differenz in jedem Proportionspaar durchzuführen, möglicherweise mit einer Korrektur des Werts (z. B. Bonferroni).
Antworten:
Zu meiner Überraschung schienen einige Suchanfragen nicht aufgetaucht zu sein. Ich erwarte, dass es wahrscheinlich irgendwo einen gibt, aber da ich ihn nicht leicht finden kann, halte ich es für vernünftig, meine Kommentare in eine Antwort umzuwandeln, damit die Leute diesen zumindest mit denselben Suchbegriffen finden können, die ich gerade verwendet habe.
Die paarweisen Vergleiche, die Sie anstreben (vorausgesetzt, Sie vergleichen nur die beiden beteiligten Gruppen), sind sinnvoll.
Dies läuft darauf hinaus, Gruppenpaare zu nehmen und zu testen, ob sich der Anteil in einer der Gruppen von 1/2 unterscheidet (ein Proportionen-Test mit einer Stichprobe). Dies kann - wie Sie vorschlagen - als Z-Test durchgeführt werden (obwohl Binomialtest und Chi-Quadrat-Anpassungsgüte auch funktionieren würden).
Viele der üblichen Ansätze zum Umgang mit der Gesamtfehlerrate von Typ I sollten hier funktionieren (einschließlich Bonferroni - zusammen mit den üblichen Problemen, die damit verbunden sein können).
quelle
so you suggest compare 16 and 14 against 15/15
@ Niksr, nein. Glen vergleicht die beiden Gruppen in50/50
Prozent. Die 3. Gruppe ist vom Vergleich ausgeschlossen.Ich hatte das gleiche Problem (und war froh, diesen Beitrag zu finden). In Sheskin (2003: 225) habe ich jetzt auch eine kurze Notiz zu diesem Thema gefunden, die ich nur mitteilen wollte:
"Eine andere Art von Vergleich, die durchgeführt werden kann, besteht darin, nur zwei der ursprünglichen sechs Zellen miteinander zu vergleichen. Nehmen wir insbesondere an, wir möchten Zelle 1 / Montag mit Zelle 2 / Dienstag vergleichen Da wir im obigen Beispiel nur zwei Zellen verwenden, beträgt die Wahrscheinlichkeit für jede Zelle π_i = 1/2. Die erwartete Häufigkeit jeder Zelle wird erhalten, indem π_i = 1/2 mit der Gesamtzahl der Beobachtungen in den beiden Zellen multipliziert wird (welche Wie bereits erwähnt, muss sich der Forscher bei einem Vergleich wie dem oben genannten mit dem Wert von Alpha auseinandersetzen, der für die Bewertung der Nullhypothese verwendet werden soll. "
Sheskin, DJ 2003. Handbuch für parametrische und nichtparametrische statistische Verfahren: Dritte Auflage. CRC-Presse.
quelle