In dem Buch "Die Elemente des statistischen Lernens" in Kapitel 2 ("Lineare Modelle und kleinste Quadrate; Seite Nr. 12") steht das geschrieben
Im (p + 1) -dimensionalen Eingabe-Ausgabe-Raum repräsentiert (X, Y) eine Hyperebene. Wenn die Konstante in X enthalten ist, enthält die Hyperebene den Ursprung und ist ein Unterraum. Wenn nicht, handelt es sich um eine affine Menge, die die Y-Achse am Punkt (0, ) schneidet .
Ich verstehe den Satz "wenn Konstante ... (0, )" nicht ". Bitte helfen Sie? Ich denke, die Hyperebene würde in beiden Fällen die Y-Achse bei (0, ) schneiden. Ist das richtig?
Die Antwort unten hat etwas geholfen, aber ich suche nach einer genaueren Antwort. Ich verstehe, dass wenn im , es keinen Ursprung enthält, aber wie würde dann das den Ursprung enthalten? Sollte es nicht vom Wert von abhängen ? Wenn intercept nicht , sollte nach meinem Verständnis keinen Ursprung enthalten?
quelle
Antworten:
Das Einfügen der KonstanteβX β0+βX
1
in den Eingabevektor ist ein gängiger Trick, um eine Verzerrung einzuschließen (denken Sie an den Y-Achsenabschnitt), aber alle Begriffe des Ausdrucks symmetrisch zu halten: Sie können überall anstelle von schreiben .Wenn Sie dies tun, ist es richtig, dass die Hyperebene den Ursprung enthält, da der Ursprung ein Vektor von Werten ist und das Multiplizieren mit den Wert ergibt .Y=βX 0 β 0
Ihre Eingabevektoren haben jedoch immer das erste Element gleich ; Daher werden sie niemals den Ursprung enthalten und auf einer kleineren Hyperebene platziert, die eine Dimension weniger hat.1
Sie können dies visualisieren, indem Sie an eine Linie auf Ihrem Blatt Papier denken (2 Dimensionen). Die entsprechende Hyperebene, wenn Sie die VorspannungY=mx+q q X=[x,x0=1] β=[m,q] x0=1
quelle
Um Ihnen das Verständnis zu erleichtern, habe ich einen sehr einfachen Fall visualisiert.
Daher wäre die offensichtliche Darstellung in diesem Fall (2d) eine Hyperebene (eine Linie) im (p + 1) -dimensionalen Raum:
quelle