Warum R im Quadrat melden?

8

Wenn das angepasste R-Quadrat dem R-Quadrat überlegen ist, warum meldet statistische Software dann weiterhin letzteres? Gibt es eine Situation, in der ein Forscher es vorziehen könnte, R-Quadrat anstelle von angepasstem R-Quadrat zu verwenden?

Mike Senin
quelle
Mit welcher Art von Regression haben Sie es zu tun? Wenn ich mich nicht für eine lineare Regression halte, gibt es keinen Unterschied zwischen dem R-Quadrat und dem angepassten R-Quadrat. In diesem Fall ist es daher sehr angebracht, den einfachen R-Quadrat-Wert zu verwenden.
Alesc
Eine lineare. Statistische Pakete bieten jedoch beide Maßnahmen. Deshalb frage ich mich warum.
Mike Senin
Nun, laut Wiki ist die Gleichung selbst für die lineare Regression etwas anders ( p=1). Der springende Punkt des angepassten R-Quadrats ist jedoch: " Die Verwendung eines angepassten R2 ist ein Versuch, das Phänomen des R2 zu berücksichtigen, das automatisch und falsch zunimmt, wenn dem Modell zusätzliche erklärende Variablen hinzugefügt werden. " Die lineare Regression hat keine zusätzliche erklärende Variable, da sie die primitivste Art der Regression ist.
Alesc
@alesc, das weiß ich. Was ich nicht weiß, ist, warum beide Werte gemeldet werden sollen.
Mike Senin
Was versuchst du mit deinem R-Quadrat-Wert zu beweisen? Vergleichen Sie verschiedene Regressionsmodelle? Wenn Sie lineare und nichtlineare Regressionsmodelle vergleichen, ist es sinnvoll, ein angepasstes R-Quadrat zu verwenden, da sonst das einfache R-Quadrat ausreicht. Andererseits können Sie das angepasste R-Quadrat auch für die lineare Regression verwenden :) Ich persönlich würde nicht beide Werte angeben. Wählen Sie also eine Metrik und geben Sie nur diesen Wert an (entweder R-Quadrat oder angepasstes R-Quadrat).
Alesc

Antworten:

5

Unter Bedingungen , beispielsweise erläutert hier , misst den Anteil der Varianz in der abhängigen Variablen erklärt durch die Regression, die eine natürliche Maßnahme ist. Das angepasste hat diese Interpretation nicht, da es den Wert modifiziert .R 2 R 2R.2R.2R.2

Während also angepasstes den unbestreitbaren Vorteil hat, nicht automatisch zu steigen, wenn die Anzahl der Regressoren steigt, zahlen Sie einen Preis dafür, wie Sie das Maß interpretieren können.R.2

Hinweis: Ich befürworte nicht die Verwendung des einen oder anderen, sondern gebe nur einen möglichen Grund an, warum die Leute immer noch den Standard .R.2

Christoph Hanck
quelle
Kurze Frage: Stimmt es vielleicht, dass ist ein konsistenter Schätzer der Population R 2 unter bestimmten Bedingungen, z. B. ein genau spezifiziertes Modell? Dann wäre es sinnvoll, R 2 a d j zu melden . anstelle von R 2 . Radj.2R2Radj.2R.2
Richard Hardy
3
R.eindj.2=1- -n- -1n- -K.+n- -1n- -K.R.2n- -1n- -K.1K.nR.eindj.2- -R.2=Öp(1)
K.
1
R.21- -σ2/.V.einr(y)R.eindj.2=1- -s2ich(y- -y¯)2/.(n- -1)s2n- -K.yE.(s2)=σ2E.[ich(y- -y¯)2/.(n- -1)]]=V.einr(y)
1
Vielen Dank. Vielleicht hätte ich meine Kommentare als separate Frage posten sollen, dann hätte ich Ihre Antworten positiv bewerten können. Da ich vermutete, dass ähnliche Dinge gefragt wurden, hoffte ich nur auf eine kurze Bestätigung / Nichtbestätigung, einen Kommentarstil. Sie waren expliziter als das, ich schätze es!
Richard Hardy
1

Das angepasste R-Quadrat ist nützlich, um verschiedene Regressionsmodelle zu vergleichen. Diese Aufgabe kann nicht durch das R-Quadrat erfüllt werden, das, wie andere bereits gesagt haben, ein weiteres informatives Ziel hat, nämlich den Anteil der Varianz der abhängigen Variablen auszudrücken, der durch das untersuchte Regressionsmodell erklärt wird.

Carlo Lazzaro
quelle