Lineare Projektion in „Die Elemente des statistischen Lernens“ verstehen

8

In dem Buch "Die Elemente des statistischen Lernens" in Kapitel 2 ("Lineare Modelle und kleinste Quadrate; Seite Nr. 12") steht das geschrieben

Im (p + 1) -dimensionalen Eingabe-Ausgabe-Raum repräsentiert (X, Y) eine Hyperebene. Wenn die Konstante in X enthalten ist, enthält die Hyperebene den Ursprung und ist ein Unterraum. Wenn nicht, handelt es sich um eine affine Menge, die die Y-Achse am Punkt (0, ) schneidet .β

Ich verstehe den Satz "wenn Konstante ... (0, )" nicht ". Bitte helfen Sie? Ich denke, die Hyperebene würde in beiden Fällen die Y-Achse bei (0, ) schneiden. Ist das richtig?ββ

Die Antwort unten hat etwas geholfen, aber ich suche nach einer genaueren Antwort. Ich verstehe, dass wenn im , es keinen Ursprung enthält, aber wie würde dann das den Ursprung enthalten? Sollte es nicht vom Wert von abhängen ? Wenn intercept nicht , sollte nach meinem Verständnis keinen Ursprung enthalten?1X(X,Y)ββ00(X,Y)

Abhinav Gupta
quelle
2
Wie viel lineare Algebra haben Sie getan? Wissen Sie, was Vektoren sind? Was ist mit Vektorräumen, Teilräumen, ...?
Adrian
Ich habe ein grundlegendes Verständnis von linearer Algebra, Vektor und Vektorräumen.
Abhinav Gupta
1
en.wikipedia.org/wiki/Hyperplane hat ein bisschen über affine Hyperebenen und Vektor-Hyperebenen
Adrian
Thnaks! Lies einfach diesen Artikel. Aber ich verstehe immer noch nicht, wie man sagen kann, dass die Hyperebene den Ursprung enthält, wenn der Contant in X enthalten ist. Wenn dies klar ist, verstehe ich, warum die Hyperebene ein Unterraum ist.
Abhinav Gupta
Seite Nr.: 12. Ich habe die Frage auch bearbeitet.
Abhinav Gupta

Antworten:

4

Das Einfügen der Konstante 1in den Eingabevektor ist ein gängiger Trick, um eine Verzerrung einzuschließen (denken Sie an den Y-Achsenabschnitt), aber alle Begriffe des Ausdrucks symmetrisch zu halten: Sie können überall anstelle von schreiben .βXβ0+βX

Wenn Sie dies tun, ist es richtig, dass die Hyperebene den Ursprung enthält, da der Ursprung ein Vektor von Werten ist und das Multiplizieren mit den Wert ergibt .Y=βX0β0

Ihre Eingabevektoren haben jedoch immer das erste Element gleich ; Daher werden sie niemals den Ursprung enthalten und auf einer kleineren Hyperebene platziert, die eine Dimension weniger hat.1

Sie können dies visualisieren, indem Sie an eine Linie auf Ihrem Blatt Papier denken (2 Dimensionen). Die entsprechende Hyperebene, wenn Sie die VorspannungY=mx+qqX=[x,x0=1]β=[m,q]x0=1

giorgiosironi
quelle
Ich verstehe es immer noch nicht ganz. Das Buch sagt: "Wenn die Konstante in X enthalten ist, enthält die Hyperebene den Ursprung und ist ein Unterraum." Wie Sie bereits angegeben haben, haben Eingabevektoren immer das erste Element = 1, enthalten also niemals den Ursprung. Wie kann also eine Konstante eingeschlossen werden?
Ich
x0x0=1x0=1
0

Um Ihnen das Verständnis zu erleichtern, habe ich einen sehr einfachen Fall visualisiert.

X1Yβ0=5β1=2X1

Y^=β0+β1×X1

Daher wäre die offensichtliche Darstellung in diesem Fall (2d) eine Hyperebene (eine Linie) im (p + 1) -dimensionalen Raum:

Konstante nicht in x enthalten

X0Y^=β0×X0+β1×X1

X0

Konstante in x enthalten

X0=1

grll
quelle