Was machst du, wenn deine Freiheitsgrade über das Ende deiner Tische hinausgehen?

11

Die Freiheitsgrade in meiner F-Tabelle sind für meine große Stichprobe nicht hoch genug.

Wenn ich beispielsweise ein F mit 5 und 6744 Freiheitsgraden habe, wie finde ich den kritischen Wert von 5% für eine ANOVA?

Was wäre, wenn ich einen Chi-Quadrat-Test mit großen Freiheitsgraden machen würde?

[Eine Frage wie diese wurde vor einiger Zeit veröffentlicht, aber das OP hat einen Fehler gemacht und hatte tatsächlich einen kleineren df, wodurch dieser auf ein Duplikat reduziert wurde - aber die ursprüngliche große df-Frage sollte irgendwo vor Ort eine Antwort haben]

Glen_b - Monica neu starten
quelle
1
Einen größeren Tisch bekommen?
Federico Poloni

Antworten:

16

F-Tabellen :

  1. Der einfachste Weg von allen - wenn Sie können - ist die Verwendung eines Statistikpakets oder eines anderen Programms, um Ihnen den kritischen Wert zu geben. In R können wir beispielsweise Folgendes tun:

     qf(.95,5,6744)
    [1] 2.215425
    

    (Sie können aber genauso einfach einen genauen p-Wert für Ihr F berechnen).

  2. Normalerweise haben F-Tabellen am Ende der Tabelle einen Freiheitsgrad von "unendlich", einige jedoch nicht. Wenn Sie eine sehr große df haben (zum Beispiel ist 6744 sehr groß), können Sie stattdessen den Eintrag unendlich ( ) verwenden.

    Sie könnten also Tabellen für , die 120 df und df ergeben:ν1=5

          ...    5      ...
     ⁞
    120        2.2899   
     ∞         2.2141
    

    Die df-Zeile dort funktioniert für jedes wirklich große ν 2 (Nenner df). Wenn wir das verwenden, haben wir 2.2141 anstelle der exakten 2.2154, aber das ist nicht schlecht.ν2

  3. Wenn Sie keinen Eintrag für unendlich viele Freiheitsgrade haben, können Sie einen aus einer Chi-Quadrat-Tabelle herausarbeiten, indem Sie den kritischen Wert für den Zähler df geteilt durch diesen df verwenden

    Nehmen Sie zum Beispiel für einen kritischen Wert von , einen kritischen Wert von χ 2 5 und dividieren Sie durch 5 . Der kritische Wert von 5% für a χ 2 5 beträgt 11.0705 . Wenn wir durch 5 teilen , ist das 2.2141, was die Zeile aus der obigen Tabelle ist.F5,χ525χ5211.070552.2141

  4. Wenn Ihre Freiheitsgrade etwas zu klein sind, um den Eintrag "unendlich" zu verwenden (aber immer noch viel größer als 120 oder was auch immer Ihre Tabelle betrifft), können Sie die inverse Interpolation zwischen dem höchsten endlichen df und dem Eintrag "unendlich" verwenden. Angenommen, wir möchten einen kritischen Wert für df berechnenF5,674

       F       df     120/df    
     ------   ----    -------
     2.2899    120      1     
       C       674    0.17804
     2.2141     ∞       0    
    

    Dann berechnen wir den unbekannten kritischen Wert asC

    C2.2141+(2.28992.2141)×(0.178040)/(10)2.2276

    (Der genaue Wert ist , das funktioniert also ziemlich gut.)2.2274

    Weitere Details zur Interpolation und inversen Interpolation finden Sie in diesem verlinkten Beitrag.


Chi-Quadrat-Tische :

Wenn Ihr Chi-Quadrat-df wirklich groß ist, können Sie normale Tabellen verwenden, um eine Annäherung zu erhalten.

Für großes df die Chi-Quadrat-Verteilung mit dem Mittelwert ν und der Varianz 2 ν ungefähr normal . Um den oberen 5% -Wert zu erhalten, nehmen Sie den einseitigen kritischen 5% -Wert für eine Standardnormalen ( 1,645 ) und multiplizieren Sie mit νν2ν1.645 und addiereν.2νν

Stellen Sie sich zum Beispiel vor, wir bräuchten einen oberen kritischen Wert von 5% für einen .χ67442

Wir würden 1,645 × berechnen. Die genaue Antwort (auf5signifikante Zahlen) lautet6936,2.1.645×2×6744+6744693556936.2

Wenn die Freiheitsgrade sind kleiner, können wir die Tatsache nutzen , dass , wenn ist χ 2 ν dann Xχν2.2X˙N(2ν1,1)

Wenn wir zum Beispiel df hätten, könnten wir diese Näherung verwenden. Der genaue obere kritische Wert von 5% für ein Chi-Quadrat mit 674 df beträgt (bis 5 Ziffern) 735,51 . Mit dieser Näherung würden wir wie folgt berechnen:674735.51

Nehmen Sie den oberen (einseitigen) kritischen Wert von 5% für eine Standardnormalen (1,645) und addieren Sie , quadriere die Summe und dividiere durch 2. In diesem Fall:2ν1

.(1.645+2×6741)2/2735.2

Wie wir sehen, ist dies ziemlich nah.

Für erheblich kleinere Freiheitsgrade könnte die Wilson-Hilferty-Transformation verwendet werden - sie funktioniert bis auf wenige Freiheitsgrade -, aber die Tabellen sollten dies abdecken. Diese Annäherung ist die .(Xν)13˙N(129ν,29ν)

Glen_b - Monica neu starten
quelle
2
+1 Die Idee kann verbessert werden. Verwenden Sie die Tatsache, dass F auf eine rationale Funktion einer χ 2 -Verteilung beschränkt ist, wenn ihr zweiter Parameter groß wird. In würden Sie es zum Beispiel als berechnen . Sie erhalten 2.2177 , genau auf drei signifikante Zahlen. Beachten Sie, dass der Parameter χ 2 eine kleine Ganzzahl ist, was darauf hinweist , dass er wahrscheinlich in der Tabelle enthalten und ohne Interpolation verfügbar ist. χ2Fχ2Rdf2/df1 * (-1 + 1/(1-qchisq(0.95, df1) / df2))2.2177χ2
whuber
... oder ist die Absicht, dass die Fehler der beiden Ansätze in entgegengesetzter Richtung sind (was vielleicht darauf hindeutet, die beiden zu kombinieren?).
Glen_b -Rate State Monica
Ich erinnere mich, dass ich mich auf Punkt 4 bezog.
whuber
Ah, das könnte sinnvoller sein. Tut mir leid, dicht zu sein. Ich werde es noch einmal versuchen.
Glen_b -Rate State Monica