Angenommen, es gibt drei Zeitreihen, , und
Laufende gewöhnliche lineare Regression auf ~ ( ), erhalten wir . Die gewöhnliche lineare Regression ~ erhält . Angenommen,
Was sind die minimal und maximal möglichen Werte von bei der Regression ~ ( )?
Ich glaube, das Minimum sollte + ein kleiner Wert sein, da das Hinzufügen neuer Variablen immer erhöht , aber ich weiß nicht, wie ich diesen kleinen Wert quantifizieren soll, und ich weiß nicht, wie ich den maximalen Bereich erhalten kann .
quelle
Lassen gleich die Korrelation zwischen und , gleich der Korrelation zwischen und und der Korrelation zwischen und . Dann ist für das vollständige Modell geteilt durch gleichr1,2 X1 X2 r1,Y X1 Y r2,Y X2 Y R2 V
Also ist für das vollständige Modell nur dann gleich , wenn und oder V r 1 , 2 = 0 r 2 1 , Y = U = 0R2 V r1,2=0 r21,Y=U=0
Wenn , für das Vollmodell gleich .R 2 U + V.r1,2=0 R2 U+V
quelle
Ohne Einschränkungen für und ist das Minimum und das Maximum das kleinere . Dies liegt daran, dass zwei Variablen perfekt korreliert sein könnten (in diesem Fall ändert das Hinzufügen der zweiten Variablen das überhaupt nicht) oder sie könnten orthogonal sein, in welchem Fall beide Ergebnisse in . In den Kommentaren wurde zu Recht darauf hingewiesen, dass dies auch erfordert, dass jedes orthogonal zu , dem Spaltenvektor von 1s.U V V R 2 U + V 1min(V+U,1) R2 U+V 1
Sie haben die Einschränkung hinzugefügt, die . Es ist jedoch immer noch möglich, dass . Das heißt, , in welchem Fall . Schließlich ist es möglich, dass so dass die Obergrenze immer noch . U = 0 X 1 ≤ Y min = max = V + 0 X 1 ≤ X 2 min ( V + U , 1 )U<V⟹X1≠X2 U=0 X1⊥Y min=max=V+0 X1⊥X2 min(V+U,1)
Wenn Sie mehr über die Beziehung zwischen und wüssten , könnten Sie wahrscheinlich mehr sagen. X 2X1 X2
quelle