Ich habe eine einfache lineare Regression des natürlichen Logarithmus von 2 Variablen durchgeführt, um festzustellen, ob sie korrelieren. Meine Ausgabe ist diese:
R^2 = 0.0893
slope = 0.851
p < 0.001
Ich bin verwirrt. Wenn ich den Wert betrachte, würde ich sagen, dass die beiden Variablen nicht korreliert sind, da sie so nahe bei . Die Steigung der Regressionslinie beträgt jedoch fast (obwohl sie im Diagramm fast horizontal erscheint), und der p-Wert zeigt an, dass die Regression hoch signifikant ist. 0 1
Bedeutet dies , dass die beiden Variablen sind stark korreliert? Wenn ja, was zeigt der -Wert an?
Ich sollte hinzufügen, dass die Durbin-Watson-Statistik in meiner Software getestet wurde und die Nullhypothese ( ) nicht zurückwies . Ich dachte, dass dies für die Unabhängigkeit zwischen den beiden Variablen getestet . In diesem Fall würde ich erwarten, dass die Variablen abhängig sind, da es sich um zwei Messungen eines einzelnen Vogels handelt. Ich mache diese Regression als Teil einer veröffentlichten Methode, um den Körperzustand eines Individuums zu bestimmen. Daher nahm ich an, dass die Verwendung einer Regression auf diese Weise Sinn macht. Angesichts dieser Ergebnisse denke ich jedoch, dass diese Methode für diese Vögel möglicherweise nicht geeignet ist. Scheint dies eine vernünftige Schlussfolgerung zu sein?
Antworten:
Der geschätzte Wert der Steigung allein sagt noch nichts über die Stärke der Beziehung aus. Die Stärke der Beziehung hängt von der Größe der Fehlervarianz und dem Bereich des Prädiktors ab. Ein signifikanter Wert sagt nicht unbedingt aus, dass eine starke Beziehung besteht. Der p- Wert testet einfach, ob die Steigung genau 0 ist. Bei einer ausreichend großen Stichprobe führen selbst kleine Abweichungen von dieser Hypothese (z. B. solche, die nicht von praktischer Bedeutung sind) zu einem signifikanten p- Wert.p p p
Von den drei Größen, die Sie angegeben haben, gibt , der Bestimmungskoeffizient , den größten Hinweis auf die Stärke der Beziehung. In Ihrem Fall bedeutet R 2 = 0,089 , dass 8,9 % der Variation Ihrer Antwortvariablen als linearer Zusammenhang mit dem Prädiktor erklärt werden können. Was einen "großen" R 2 ausmacht, ist disziplinabhängig. Zum Beispiel könnte in den Sozialwissenschaften R 2 = .2 "groß" sein, aber in kontrollierten Umgebungen wie einer Werkseinstellung ist R 2 > .9R2 R2=.089 8.9% R2 R2=.2 R2>.9 Möglicherweise müssen Sie angeben, dass eine "starke" Beziehung besteht. In den meisten Situationen ist ein sehr kleines R 2 , daher ist Ihre Schlussfolgerung, dass es eine schwache lineare Beziehung gibt, wahrscheinlich vernünftig..089 R2
quelle
Der gibt an, wie viel Variation der abhängigen Variablen durch ein Modell erklärt wird. Man kann jedoch sowohl R 2 als auch die Korrelation zwischen den ursprünglichen Werten der abhängigen Variablen und den angepassten Werten interpretieren . Die genaue Interpretation und Herleitung des Bestimmtheitsmaßes R 2 finden Sie hier .R2 R2 R2
Der Beweis , dass der Koeffizient der Bestimmung ist das Äquivalent der quadrierten Pearson - Korrelationskoeffizienten zwischen den beobachteten Werten und die angepaßten Werte y i gefunden werden kann hier .yich y^ich
Das oder der Bestimmungskoeffizient gibt die Stärke Ihres Modells an, um die abhängige Variable zu erläutern. In Ihrem Fall ist R 2 = 0,089 . Damit kann Ihr Modell 8,9% der Variation Ihrer abhängigen Variablen erklären. Oder der Korrelationskoeffizient zwischen y i und Ihren angepassten Werten y i ist 0,089. Was ein gutes R 2 ausmacht, ist disziplinabhängig.R2 R2= 0,089 yich y^ich R2
Schließlich zum letzten Teil Ihrer Frage. Sie können den Durbin-Watson-Test nicht dazu bringen, etwas über die Korrelation zwischen Ihren abhängigen und unabhängigen Variablen zu sagen. Der Durbin-Watson-Test prüft die serielle Korrelation. Es wird geprüft, ob Ihre Fehlerausdrücke miteinander korreliert sind.
quelle
quelle
Kurz gesagt, die Steigung ist kein guter Indikator für die Modellanpassung, es sei denn, Sie sind sich sicher, dass die Skalen der abhängigen und unabhängigen Variablen gleich sein müssen.
quelle
Ich mag die bereits gegebenen Antworten, aber lasse mich sie mit einem anderen (und ironischeren) Ansatz ergänzen.
Angenommen, wir sammeln eine Reihe von Beobachtungen von 1000 zufälligen Personen, die versuchen herauszufinden, ob Schläge im Gesicht mit Kopfschmerzen verbunden sind:
Grafisch sieht dies wahrscheinlich wie ein steiler Hang aus, jedoch mit einer sehr großen Abweichung um diesen Hang herum.
quelle
@Macro hatte eine tolle Antwort.
Ich möchte nur ein numerisches Beispiel hinzufügen, um zu zeigen, wie es aussieht, wenn ein Fall-OP beschrieben wird.
quelle