Warum werden Regressionskoeffizienten in einem Faktoranalysemodell als „Belastungen“ bezeichnet?

In diesen Thread schreibt @ttnphns das

Da es sich um [...] Regressionskoeffizienten handelt, bestehe ich darauf, dass es besser ist, "Faktorlasten variabel" als "variabler Lastfaktor" zu sagen.

Ich habe hier gelernt , dass ein Faktoranalysemodell das Gleichungssystem ist

$V_1 = a_{1I}F_I + a_{1II}F_{II} + E_1$

$V_2 = a_{2I}F_I + a_{2II}F_{II} + E_2$

$...$

$V_p = …$

Dabei ist der Koeffizient a eine Belastung, F ein Faktor [...] und die Variable E Regressionsreste.

Ich verstehe jedoch nicht, wie sich daraus ergibt, dass wir "Faktor lädt variabel" sagen sollten und nicht umgekehrt. Was macht den Begriff "Laden" aus?

Ich weiß auch nicht, warum wir den Begriff "Laden" überhaupt brauchen, als wir bereits den Begriff "Regressionskoeffizient" hatten. Liegt es daran, dass die Regressionskoeffizienten manchmal auch Korrelationskoeffizienten sind und Statistiker einen Oberbegriff wollten, der beide Fälle abdeckt?

Ich hoffe, dass die Antwort auf diese Frage es den Schülern leichter macht, sich daran zu erinnern, dass Faktoren beobachtete Variablen laden, und nicht umgekehrt.

factor-analysis terminology teaching user1205901 - Monica wiederherstellen
quelle

Ich kann mich nie erinnern, was "geladen" werden soll (oder geladen werden soll? Oder von was geladen werden soll? Usw.), und deshalb vermeide ich es, in diesem Zusammenhang das Verb "laden" zu verwenden. Ich sage allerdings "Ladungen". Beachten Sie jedoch, dass FA keine Regression ist und es hier keine "Regressionskoeffizienten" gibt, zumindest nicht im üblichen Sinne des Wortes. Ich denke, es wäre nur verwirrend, Regressionskoeffizienten zu nennen . Nennen Sie es entweder gar nichts oder "Ladungen". Sie sind aber keine Regressionskoeffizienten!

A

$A$

Amöbe

@amoeba, sagen, FA is not a regressionSie sind beide richtig und nicht richtig. FA als Extraktionsverfahren ist natürlich nicht ein Regressionsverfahren. Das FA- Modell ist jedoch ein Regressionsmodell. Wenn wir in der Lage waren, wahre Fs-Werte (anstelle von ungefähren Werten) zu kennen und die Anpassung ausgezeichnet war (bezüglich der Reproduktion von Korrelationen durch die Belastungen), und wir beschließen, die Vs durch die Werte dieser Fs zu regressieren, werden die Belastungen als unsere herauskommen Parameterschätzungen.

ttnphns

Ich verstehe nicht, wie es folgt, dass wir "Faktor lädt variabel" sagen sollten und nicht umgekehrt

Abstrakte Erklärung . Wenn ein als Objekt gesehener Punkt eine Koordinate auf einer Achse hat, die als Merkmal betrachtet wird, gibt die Koordinate an, wie viel das Merkmal den Punkt lädt und wie viel es diesen Punkt selbst auflädt. Wenn meine Höhe 1,86 m beträgt, werde ich auf diese Weise nach Höhe geladen (nicht wie viel Höhe von mir geladen wird). Beachten Sie, dass das Laden die Koordinate der Variablen auf dem Faktor als Achse im Ladediagramm ist .

Erklärung der latenten Merkmale . Faktor wird als eine Entität konzipiert, die "in" den Variablen oder "hinter" ihnen spielt und sie korrelieren lässt. Daher ist "Laden" intuitiv ein gutes Wort, um den Grad auszudrücken, in dem die Variable vom latenten Faktor abhängig ist, angetrieben von diesem. Das Faktoranalysemodell ist ein Regressionsmodell, bei dem Faktoren beobachtete Variablen erklären oder "beeinflussen". Jeder Regressionskoeffizient (nicht nur faktoranalytisch) kann als "Belastung" bezeichnet werden: Regressionskoeffizient = Regressionsgewicht = Regressionsbelastung. Ein weiterer Grund, den Koeffizienten eines Faktors als "Belastung" zu bezeichnen, ergibt sich aus der Tatsache, dass im Faktormodell die Faktoren s standardisiert sind, wobei jede Einheitsvarianz eine Variable $F$ $V$ ist nicht unbedingt standardisiert. Es kommt daher, dass die Wirkung auf vollständig und nur über die Belastungskoeffizienten realisiert / ausgedrückt wird. Immer wenn im Regressionsmodell eine standardisierte Variable eine möglicherweise nicht standardisierte vorhersagt, nennen Sie den Koeffizienten "Belastung". $V$

Warum wir den Begriff "Laden" überhaupt brauchen, wenn wir bereits den Begriff "Regressionskoeffizient" hatten

Wir brauchen eigentlich nicht. Das Wort "Laden" ist einfach eine Tradition, die sich aus der Vorliebe der Psychologen für den bildlichen Sinn ergibt (FA begann sich vor einem Jahrhundert unter Psychologen zu entwickeln). Darüber hinaus kann der Begriff "Laden" bei anderen verwandten multivariaten Verfahren (wie der Diskriminanzanalyse) eine etwas andere statistische Bedeutung haben. Im Allgemeinen nennen einige Leute in einigen Fällen "Ladungs" -Regressionskoeffizienten, während andere oder in anderen Fällen - Korrelationskoeffizienten. Der Begriff ist also verwirrend. Es ist letztendlich kein statistischer Begriff.

Wenn Ihnen das Wort nicht gefällt, verwenden Sie es nicht. Sie können auch "variabler Lastfaktor (Ein) Faktor" sagen, wenn Sie möchten; Für mich ist es einfach eine gedankenlose Rede, kein Laster.

PS Ich habe gerade in einem englischen Wörterbuch nachgesehen (Englisch ist nicht meine Sprache) und festgestellt, dass das Laden Bedeutungen haben kann wie: (1) "Ich habe den Wagen geladen" (von einer Tasche oder von mir selbst als eingeschifft); (2) "Das Schiff lädt viele Passagiere auf." Wenn man der Verwendung des zweiten Wortes folgt, wäre es ganz in Ordnung zu sagen, dass "die Variable den Faktor (auf sich selbst, die Variable) gut lädt".

ttnphns
quelle

+1. Aber ich nenne Ladungen nicht gerne "Regressionskoeffizienten". Für mich bedeutet "Regression", dass es abhängige und unabhängige Variablen gibt und das Ziel darin besteht, Regressionskoeffizienten zu finden. In latenten Variablenmodellen wie FA gibt es nur einen Satz von Variablen, und das Ziel besteht darin, latente Variablen zu finden. Dies ist keine Regression; Die Mathematik und die Berechnungen sind völlig unterschiedlich (normalerweise benötigt man so etwas wie diese Erwartungsmaximierung, um eine FA-Lösung zu finden; EM ist in der Regression nicht erforderlich). Ich würde den Begriff "Regressionskoeffizient" für die Regression beibehalten.

Amöbe

This is not a regression@amoeba, ich habe keine Einwände gegen deine Art, diese Begriffe zu verstehen, obwohl meine Art etwas anders ist als deine. Diese Diskrepanz von uns ist von untergeordneter Bedeutung. Beachten Sie, dass "Regressionsmodell (= regressionsähnliches Modell") nicht genau "Regression (Analyse)" bedeutet. FA ist offensichtlich keine Regression, da es keine externen Y-Variablen gibt. Trotzdem modelliert es die Xs durch die irgendwie extrahierten Fs, als ob die Xs diese Ys wären. FA den Schülern als "Regressionsmodell" zu erklären, ist ein reibungsloser Ablauf.

ttnphns

Beeinflusst diese Terminologie die folgende Interpretation von Ladungen? Die Interpretation der Belastung lautet: 1. Je höher die Belastung eines PCs ist, desto mehr Einfluss hat er auf die Bildung der Variablen. 2. Je höher die Belastung einer Variablen ist, desto mehr Einfluss hat sie auf die Bildung der Hauptkomponentenbewertung. 3. Beides? Wenn es darauf ankommt, den vollständigen Beitrag hier .

user_anon

OK jetzt. 1. Richtig (normalerweise nehmen wir einen PC nicht als ehrlichen Faktor ). 2. Richtig, aber nicht einfach. Sehen Sie sich an, wie Komponenten-Score-Koeffizienten aus Ladungen berechnet werden: stats.stackexchange.com/a/126985/3277 , und erläutern Sie auch den Unterschied dieser Coef-s zu Ladungen: stats.stackexchange.com/a/191332/3277

ttnphns

@user_anon, 3). Sowohl 1 als auch 2 sind jedoch auch gültig, wenn Sie eher von Zufallsvariablen als von einem Datensatz sprechen. Eine Normalverteilung ist im Allgemeinen nicht erforderlich.

ttnphns

Warum werden Regressionskoeffizienten in einem Faktoranalysemodell als „Belastungen“ bezeichnet?

Antworten: