Angenommen, wir haben die Datenmatrix , die mal- , und den Markierungsvektor , der mal-eins ist. Hier ist jede Zeile der Matrix eine Beobachtung, und jede Spalte entspricht einer Dimension / Variablen. ( annehmen )n > p
Und was tun data space
, variable space
, observation space
, model space
bedeuten?
Ist der vom Spaltenvektor überspannte Raum ein (entarteter) D-Raum, da er Koordinaten hat, während er Rang , der als variabler Raum bezeichnet wird, da er vom variablen Vektor überspannt wird? Oder heißt es Beobachtungsraum, da jede Dimension / Koordinate einer Beobachtung entspricht?n p
Und was ist mit dem Raum, der von den Zeilenvektoren überspannt wird?
regression
multiple-regression
terminology
geometry
biplot
user3813057
quelle
quelle
Antworten:
Diese Begriffe erscheinen in einigen Büchern über multivariate Statistiken. Angenommen, Sie haben
n
Personen nachp
quantitativer Merkmalsdatenmatrix. Dann können Sie Personen als Punkte in dem Raum zeichnen, in dem die Achsen die Merkmale sind. Das wird ein klassisches Streudiagramm sein, auch bekannt als variables Raumdiagramm. Wir sagen, die Wolke von Individuen überspannt den Raum , der durch die Achsenmerkmale definiert ist.Sie können sich das Streudiagramm auch so vorstellen, dass Punkte die Variablen und die Achsen die Individuen sind. Absolut wie vorher, nur auf den Kopf gestellt. Das wird Thema Raum Grundstück (oder Beobachtungsraum Grundstück) mit den Variablen Spanning es, die Individuen zu definieren es.
Beachten Sie, dass, wenn (wie so oft)1
n>p
im zweiten Fall nur einigep
Dimensionen außerhalb dern
Dimensionen nicht redundant sind; Das bedeutet, dass Sie diep
variablen Punkte auf demp
eindimensionalen Diagramm zeichnen können und können . Traditionell sind variable Punkte normalerweise mit dem Ursprung verbunden und erscheinen daher als Vektoren (Pfeile). Wir verwenden die Darstellung des Subjektraums hauptsächlich, um Beziehungen zwischen Variablen darzustellen. Daher lassen wir die Achsen-Subjekte fallen und stellen der Einfachheit halber Punkte als Pfeile dar.Wenn Merkmale (Spalten der Datenmatrix) vor dem Zeichnen des Objektraumdiagramms zentriert wurden, entsprechen die Kosinusse der Winkel zwischen den variablen Vektoren ihren Pearson-Korrelationen, während die Vektorlängen den Normen der Variablen (Wurzelsumme der Quadrate) entsprechen ) oder Standardabweichungen (wenn durch df geteilt ).
Variabler Raum und Subjektraum sind zwei Seiten derselben Medaille, sie sind der gleiche euklidische analytische Raum, der nur spiegelbildlich zueinander dargestellt wird. Sie haben dieselben Eigenschaften wie die Eigenwerte ungleich Null und die Eigenvektoren. Es ist daher möglich, sowohl Subjekte als auch Variablen nebeneinander als Punkte im Raum der Hauptachsen (oder einer anderen orthogonalen Basis) dieses analytischen Raums darzustellen . Diese gemeinsame Darstellung wird als Biplot bezeichnet . Ich weiß nicht genau, was der Begriff "Datenraum" bedeutet - wenn er etwas Bestimmtes bedeutet, dann ist es vermutlich der gemeinsame analytische Raum, dessen Subjektraum und variabler Raum die beiden Hypostasen sind.
Einige lokale Links:
n=5
Individuen undp=2
Variablen und haben es irgendwie magisch geschafft, die 2 Punkte im 5-dimensionalen Raum zu zeichnen. Dann können Sie den durch 2 beliebige Achsen definierten Unterraum so drehen, dass die 2 Punkte (die sich von nun an über diese Ebene erstrecken) eingebettet sind. Danach lassen Sie die anderen 3 Achsen (Abmessungen) sicher fallen, da sie unnötig geworden sind. Die Position der beiden variablen Punkte relativ zueinander wurde beibehalten.quelle