Möglicher Bereich von

10

Angenommen, es gibt drei Zeitreihen, , undX1X2Y

Laufende gewöhnliche lineare Regression auf ~ ( ), erhalten wir . Die gewöhnliche lineare Regression ~ erhält . Angenommen,YX1Y=bX1+b0+ϵR2=UYX2R2=VU<V

Was sind die minimal und maximal möglichen Werte von bei der Regression ~ ( )?R2YX1+X2Y=b1X1+b2X2+b0+ϵ

Ich glaube, das Minimum sollte + ein kleiner Wert sein, da das Hinzufügen neuer Variablen immer erhöht , aber ich weiß nicht, wie ich diesen kleinen Wert quantifizieren soll, und ich weiß nicht, wie ich den maximalen Bereich erhalten kann .R2VR2

Vendetta
quelle

Antworten:

9

1) BEARBEITEN: Der Kommentar von Kardinal unten zeigt, dass die richtige Antwort auf die min Frage . Daher lösche ich meine "interessante", aber letztendlich falsche Antwort auf diesen Teil des OP-Beitrags. V.R2V

2) Das Maximum ist 1. Betrachten Sie das folgende Beispiel, das zu Ihrem Fall passt.R2

x1 <- rnorm(100)
x2 <- rnorm(100)
y <- x1 + 2*x2

> summary(lm(y~x1))$r.squared
[1] 0.2378023                 # This is U
> summary(lm(y~x2))$r.squared
[1] 0.7917808                 # This is V; U < V
> summary(lm(y~x1+x2))$r.squared
[1] 1

Hier legen wir die Varianz von auf 0 fest. Wenn Sie jedoch möchten , ändern sich die Dinge ein wenig. Sie können das beliebig nahe an 1 bringen, indem Sie kleiner machen, aber wie beim minimalen Problem können Sie nicht dorthin gelangen, also gibt es kein Maximum. 1 wird zum Supremum , da es immer größer als aber es ist auch die Grenze als .σ 2 ϵ > 0 R 2 σ 2 ϵ R 2 σ 2 ϵ0ϵσϵ2>0R2σϵ2R2σϵ20

jbowman
quelle
2
(+1) Einige Kommentare: Dies ist eine gute Antwort; es ist interessant , dass Sie einen asymptotischen Ansatz genommen haben , während es nicht klar, ob die OP in diesem oder, möglich interessiert war, eine Fest eine (oder beide). Diese Antwort ist ein wenig inkonsistent mit der Einschränkung des OP, dass ist, und wenn oder für einige ist, dann das Minimum für Alle festen Stichprobengrößen sind genau . (Entschuldigen Sie die Pathologie dieser Beispiele.) Außerdem ist OLS nicht unbedingt konsistent , wenn keine zusätzlichen Einschränkungen für die Prädiktoren vorliegen. :)U < V X 1 = 0 X 1 = a 1 a R R 2 V : = V ( n )nU<VX1=0X1=a1aRR2V:=V(n)
Kardinal
@cardinal - Beim erneuten Lesen kann ich nicht herausfinden, warum ich diesen Ansatz für das Min-Problem gewählt habe, wenn nun wie die offensichtlich richtige Antwort erscheint und ich, wie Sie implizit beobachtet haben, ein Beispiel hätte konstruieren können, mit dem dies erreicht wird die Ader des Maximalteils ... na ja, vielleicht war mein Espresso heute Morgen versehentlich entkoffeiniert. (Vielleicht sollte ich meine Antworten vor dem Posten auch gründlicher überprüfen!)V
jbowman
Ich glaube nicht , sollten Sie entfernen , was Sie geschrieben haben, was ich habe einen interessanten Ansatz finden , die Frage zu beantworten! Während die Pathologien, die ich erwähne, sicherlich ein Minimum von zulassen , könnte man sich fragen, was wirklich mit gemeint ist . Das andere Beispiel ist vielleicht nicht ganz so pathologisch, da es sich in einer allgemeinen Version dieses Problems auf den Fall erstreckt, in dem sich zusätzliches im Spaltenraum der anderen Prädiktoren befindet. :)R2X1=0Xi
Kardinal
1
@ Cardinal - danke! Ich werde es rekonstruieren, vielleicht etwas formeller, und es in einer Weile wieder unten einfügen.
Jbowman
5

Lassen gleich die Korrelation zwischen und , gleich der Korrelation zwischen und und der Korrelation zwischen und . Dann ist für das vollständige Modell geteilt durch gleichr1,2X1X2r1,YX1Yr2,YX2YR2V

(1(1r1,22))(12r1,2r1,Yr2,Y+UV).

Also ist für das vollständige Modell nur dann gleich , wenn und oder V r 1 , 2 = 0 r 2 1 , Y = U = 0R2Vr1,2=0r1,Y2=U=0

r1,22=2r1,2r1,Yr2,YUV.

Wenn , für das Vollmodell gleich .R 2 U + V.r1,2=0R2U+V

Margot
quelle
(+1) Süß. Willkommen auf der Website. Bitte registrieren Sie Ihr Konto, damit Sie besser teilnehmen können. Ich werde diesen Ausdruck später etwas genauer betrachten müssen. :)
Kardinal
4

Ohne Einschränkungen für und ist das Minimum und das Maximum das kleinere . Dies liegt daran, dass zwei Variablen perfekt korreliert sein könnten (in diesem Fall ändert das Hinzufügen der zweiten Variablen das überhaupt nicht) oder sie könnten orthogonal sein, in welchem ​​Fall beide Ergebnisse in . In den Kommentaren wurde zu Recht darauf hingewiesen, dass dies auch erfordert, dass jedes orthogonal zu , dem Spaltenvektor von 1s.UVVR 2 U + V 1min(V+U,1)R2U+V1

Sie haben die Einschränkung hinzugefügt, die . Es ist jedoch immer noch möglich, dass . Das heißt, , in welchem ​​Fall . Schließlich ist es möglich, dass so dass die Obergrenze immer noch . U = 0 X 1Y min = max = V + 0 X 1X 2 min ( V + U , 1 )U<VX1X2U=0X1Ymin=max=V+0X1X2min(V+U,1)

Wenn Sie mehr über die Beziehung zwischen und wüssten , könnten Sie wahrscheinlich mehr sagen. X 2X1X2

Joshua
quelle
1
(+1) Beachten Sie jedoch, dass es nicht (ganz) wahr ist, dass wenn und orthogonal sind, sich ihre individuellen Werte summieren, wenn beide in das Modell aufgenommen werden. Wir auch brauchen , um sie auf die alle-ones orthogonal sein Vektor . Beachten Sie, dass Sie auf dieser Site zum Markieren der Mathematik verwenden können. :)X 2 R 2 1 L.X1X2R21LATEX
Kardinal
Das ist wahr. Vielen Dank für die Kommentare und den Hinweis, dass verwendet werden kann. Ich dachte, es könnte sein, hatte aber versucht, im Mathjax-Stil zu entkommen (und [für Inline / Gleichungen. Das Schreiben wie in TeX hat wie ein Zauber funktioniert :)LATEX
Joshua