Ein Name für bedienerabhängiges Kreuzprodukt

8

Angenommen, wir haben eine n×p Matrix M. Unterschiedliche Transformationen mit unterschiedlichen spaltenweisen Operatoren können zu neuen führenp×p symmetrische Matrix . Zum Beispiel kann die Kovarianzmatrix unter Verwendung des Punktproduktoperators berechnet werden , wobei jeder Wert der Kovarianzmatrix das Punktprodukt zweier Spalten der ursprünglichen Matrix (geteilt durch ) ist. ::S CMn1

C=1n1MTM

Ebenso die Korrelationsmatrix P kann definiert werden durch Pij=corr(Ci,Cj) wo Ci und Cj sind Spalten von C, und corrist ein Maß für die Korrelation wie der Pearson-Produkt-Moment-Koeffizient . In diesem Fall ist der Operator der bivariate Korrelationskoeffizient.

Hat diese bedienerabhängige Transformation einen Namen?

Ismael Ghalimi
quelle
1
In dieser Antwort habe ich skizziert, wie all diese Matrizen die Modifikationen der SSCP- X'XMatrix sind. Für weiteres schulisches Interesse: Zegers, ten Berge (Psychometrica, 1985) vereinigen sich durch die einzelnen allgemeinen Formel-4-Koeffizienten: Identitätskoeffizient, Additivitätskoeffizient (basierend auf Kovarianzkoeffizient), Kosinus, Pearson-Korrelation.
ttnphns
1
Ich würde nicht empfehlen, dem Wikipedia-Artikel über "Gramian Matrix" zu glauben. Eigentlich bedeutet "Gramian" verschiedene Dinge. Beispielsweise wird dieses Wort in der Literatur zur Faktoranalyse lange (seit den 1930er Jahren) als Synonym für "positive semidefinite quadratische Matrix" verwendet. In vielen Quellen ist "Gram-Matrix" nicht dasselbe wie "Gramian-Matrix" und so weiter.
ttnphns
2
Einige vektororientierte Computersysteme wie APL und Mathematica verfügen über integrierte Verallgemeinerungen dieses Typs. Siehe beispielsweise reference.wolfram.com/language/ref/Inner.html .
whuber
2
Ismael: Wenn Sie ein Etikett für die X'XMatrix benötigen, gibt es viele oder gleichwertige, die von Menschen mit unterschiedlichen Bereichen und Hintergründen stammen. Die multivariate statistische Datenanalyse ist einer der ältesten Zweige. Dort wird es als Summe der Quadrate und Kreuzprodukte oder einfach als Kreuzproduktmatrix bezeichnet. Ich empfehle aus den in meinem obigen Kommentar genannten Gründen nicht viel, die Wörter Gramian oder Gram zu verwenden.
ttnphns
1
@ttnphns Ich denke, Ismaels Frage ist weiter gefasst, er möchte einen Namen für jeden f(Xi,Xj) Matrix wo f() kann jede (vielleicht nur symmetrische?) Funktion sein (und Xi sind Spalten von X); zB ap×p Matrix der gegenseitigen Information zwischen Variablen oder a p×pMatrix von Distanzkovarianzen zwischen ihnen, von was auch immer. Ismael, habe ich richtig verstanden? Wenn ja, dann glaube ich nicht, dass es dafür einen allgemeinen Namen gibt.
Amöbe

Antworten:

3

Mein Verständnis der Frage ist, dass sie nach einem Namen für irgendeinen fragt p×p Matrix F mit Elementen Fij=f(Xi,Xj), wo Xk sind Spalten von a n×p Datenmatrix X und f(,) ist eine beliebige Funktion.

Dies kann als Verallgemeinerung der Kovarianzmatrix angesehen werden (wenn f ist Kovarianz), Korrelationsmatrix (wenn f ist Korrelation), Summe der Quadrate und Kreuzproduktmatrix (wenn f ist Punktprodukt) usw.

Beachten Sie, dass auch wenn f ist symmetrisch und "sinnvoll", die resultierende Matrix Fkann nicht positiv-definitiv sein. Dies ist zB der Fall, wenn fist gegenseitige Information ( wie im Titel dieses Papiers angegeben ).

Ich bezweifle, dass es einen Oberbegriff für gibt F. Wenn Sie wirklich einen Namen dafür haben müssen, sollten Sie einen erfinden. Wenn deinfsoll eine Beziehung zwischen Variablen messeni und j, dann vielleicht F kann als "Beziehungsmatrix" oder einfach als "Beziehungsmatrix" bezeichnet werden?

Amöbe
quelle
Ich denke, Sie können die Sprache der Reproduktion von Kernel-Hilbert-Räumen verwenden und überlegen Fdie mit dem Kernel verknüpfte Gram-Matrix zu seinf, unter der Voraussetzung ferfüllt die Standardbedingungen.
Kardinal
2
@ Cardinal Ich überlegte, ob ich das in meiner Antwort erwähnen sollte. Aber normalerweise wird Kernel-Matrix (Gram-Matrix) so verstandenn×n, dh es misst die "Beziehungen" (Kernelabstände) zwischen den Stichproben, während hier OP a berücksichtigt p×pMatrix zur Messung der "Beziehungen" zwischen den Variablen. Also dachte ich mir, dass es verwirrend sein könnte, es Kernel / Gram-Matrix zu nennen. Was denken Sie? (Man kann auch Funktionen in Betracht ziehen, die die Kernel-Bedingungen nicht erfüllen, z. B. anscheinend gegenseitige Informationen.)
Amöbe
1
(+1) Während die Unterscheidung zwischen "Zeilen" und "Spalten" in gewissem Sinne etwas oberflächlich erscheint, sprechen Sie in meinem Kommentar einen sehr zutreffenden Punkt in Bezug auf die mögliche Verwirrung an, die durch den Vorschlag verursacht werden könnte.
Kardinal
Vielen Dank, dass Sie die Unterscheidung mit Gram-Matrizen klargestellt haben. Sehr hilfreich.
Ismael Ghalimi