Interpretieren der Zusammenfassungsfunktion für das lm-Modell in R.

10

Was bedeutet t valueund Pr(>|t|)bei Verwendung der summary()Funktion für ein lineares Regressionsmodell in R?

Coefficients:
                              Estimate Std. Error t value Pr(>|t|)    
(Intercept)                    10.1595     1.3603   7.469 1.11e-13 ***
log(var)                        0.3422     0.1597   2.143   0.0322 *
itamarbe
quelle
2
Siehe hier, letzter Satz des ersten Absatzes und hier und hier .
Glen_b -State Monica
Und für Standardfehler, siehe hier
Glen_b -Reinstate Monica

Antworten:

8

Der t-Wert in der Spalte zeigt Ihnen den t-Test, der mit dem Testen der Signifikanz des in der ersten Spalte aufgeführten Parameters verbunden ist. Zum Beispiel bezieht sich der t-Wert von 7,369 auf den t-Test von (Intercept) 10,1595 geteilt durch den Standardfehler dieser Schätzung 1,3603. Pr (> | t |) gibt Ihnen den p-Wert für diesen t-Test an (den Anteil der t-Verteilung bei diesem df, der größer ist als der absolute Wert Ihrer t-Statistik). 1.11e-13 ist wissenschaftliche Notation. Die Sternchen nach Pr (> | t |) bieten eine visuell zugängliche Möglichkeit, um zu beurteilen, ob die Statistik verschiedene Kriterien erfüllt.α

russellpierce
quelle
3

Ich bin kein guter Grok-T-Test, aber Wikipedia hat einen guten Artikel über den p-Wert - im Grunde ist der p-Wert die Wahrscheinlichkeit, dass das Ergebnis, das Sie sehen, aufgrund zufälliger Variationen passiert ist. Im Allgemeinen bedeutet ein p-Wert von 0,05 oder weniger (grob interpretiert als "es besteht eine Wahrscheinlichkeit von 5% oder weniger, dass dies nur aufgrund zufälliger Abweichungen geschieht"), dass das Ergebnis signifikant ist.

Aerik
quelle
4
Da diese Probleme auf dieser Site ausführlich diskutiert wurden, werde ich mich kurz fassen: (1) Der p-Wert ist eine Wahrscheinlichkeit , die von der Annahme der Nullhypothese abhängig ist (es ist keine bedingungslose "Chance" und wahrscheinlich kontrafaktisch ) und (2) davon ist keine Chance für "das Ergebnis, das Sie sehen" - was in diesem Fall praktisch Null ist -, sondern es ist die Chance - unter der Nullhypothese -, dass Ihr Ergebnis in einen "kritischen Bereich" für das fällt Hypothesentest. Obwohl dies wie ein Trottel erscheinen mag, kann durch die Fehlinterpretation loser Sprache viel Verwirrung entstehen.
whuber
2
@whuber - Vielen Dank, dass Sie sich die Zeit genommen haben, eine korrekte und genaue Beschreibung des p-Werts zusammenzustellen. Ich verstehe das selbst kaum, ehrlich, gab aber absichtlich eine "lose Sprache" -Antwort, um dem Fragesteller zu helfen, eine Grundidee zu bekommen, ohne ihn zu überwältigen ... scheint mir, dass viele Statistiken so sind - was eine Statistik tatsächlich sagt ist nicht so benutzerfreundlich, daher geben die Leute wirklich grobe Annäherungen an, die leichter zu verdauen sind. Ich denke, in "Six Easy Pieces" hat Feynman die Physik so erklärt. "Dies ist nicht genau, aber es ist eine nützliche Annäherung"
Aerik
1
Leider führt lose Sprache zu vielen fehlgeleiteten Handlungen, die aufgrund eines Missverständnisses ergriffen werden.
Glen_b -State Monica