Warum ist das angepasste R-Quadrat kleiner als das R-Quadrat, wenn das angepasste R-Quadrat das Modell besser vorhersagt?

15

Soweit ich weiß, erklärt , wie gut das Modell die Beobachtung vorhersagt. Das angepasste berücksichtigt mehr Beobachtungen (oder Freiheitsgrade). Also sagt Adjusted das Modell besser voraus? Warum ist das dann weniger als ? Es scheint, dass es oft mehr sein sollte.R 2 R 2 R 2R2R2R2R2

user59756
quelle

Antworten:

30

1 - S S ER2 zeigt die lineare Beziehung zwischen den unabhängigen Variablen und der abhängigen Variablen. Es ist definiert als was die Summe der quadratischen Fehler dividiert durch die Gesamtsumme der Quadrate ist. das sind der Gesamtfehler und die Gesamtsumme der Regressionsquadrate. Wenn unabhängige Variablen hinzugefügt werden, steigt weiter an (und da festgelegt ist, und steigt kontinuierlich an, unabhängig davon, wie wertvoll die von Ihnen hinzugefügten Variablen sind. SSTO=SSE+SSRSSRSSTOSSER21SSESSTOSSTO=SSE+SSRSSRSSTOSSER2

Der angepasste versucht, den statistischen Schwund zu berücksichtigen. Modelle mit einer Vielzahl von Prädiktoren schneiden in der Stichprobe in der Regel besser ab als außerhalb der Stichprobe. Das angepasste "bestraft" Sie dafür, dass Sie die zusätzlichen Prädiktorvariablen hinzufügen, die das vorhandene Modell nicht verbessern. Dies kann bei der Modellauswahl hilfreich sein. Das angepasste entspricht für eine Prädiktorvariable. Wenn Sie Variablen hinzufügen, ist diese kleiner als .R 2 R 2 R 2 R 2R2R2R2R2R2

Eric Peterson
quelle
Es ist nicht klar, wie das eingestellte R-Quadrat die spitzen Eigenschaften erreicht. Das heißt, wie lautet die Formel und wie bewirkt sie die Eigenschaften?
Alexey Voytenko
Adj R ^ 2 = 1 - ((n - 1) / (n - k - 1)) (1 - R ^ 2)
Bergsteiger
Wobei k = Anzahl unabhängiger Variablen, n = Anzahl Beobachtungen
Bergsteiger
versuchen, statistische Schrumpfung zu erklären - vielleicht wegen Überanpassung?
Richard Hardy
-1

R ^ 2 erklärt den Anteil der Variation in Ihrer abhängigen Variablen (Y), der durch Ihre unabhängigen Variablen (X) für ein lineares Regressionsmodell erklärt wird.

Während angepasst, sagt R ^ 2 den Anteil der Variation in Ihrer abhängigen Variablen (Y), der durch mehr als 1 unabhängige Variablen (X) für ein lineares Regressionsmodell erklärt wird.

Astha Gupta
quelle
1
Die Unterscheidung zwischen "unabhängigen Variablen" und "mehr als 1 unabhängigen Variablen" ist nicht klar. Außerdem zitiert Andy von unten: "Sie fügen nicht wirklich neue Informationen zu dem hinzu, was vorher bereitgestellt wurde."
Amöbe sagt Reinstate Monica
-2

R-Squared nimmt zu, auch wenn Sie Variablen hinzufügen, die nicht mit der abhängigen Variablen zusammenhängen, aber angepasstes R-Squared berücksichtigt dies, da es abnimmt, wenn Sie Variablen hinzufügen, die nicht mit der abhängigen Variablen zusammenhängen, und es daher nach sorgfältiger Prüfung wahrscheinlich ist verringern.

CHRISTOPHER MBOTWA
quelle
3
Da diese Frage bereits eine akzeptierte Antwort hat, sollte dies eher ein Kommentar sein. Sie fügen nicht wirklich neue Informationen zu dem hinzu, was zuvor bereitgestellt wurde.
Andy