Ist die Neugestaltung eines multivariaten linearen Regressionsmodells als multiple lineare Regression völlig gleichwertig? Ich beziehe mich nicht einfach laufen separate Regressionen.
Ich habe an einigen Stellen gelesen (Bayesian Data Analysis - Gelman et al. Und Multivariate Old School - Marden), dass ein multivariates lineares Modell leicht als multiple Regression umparametriert werden kann . Keine der Quellen geht jedoch darauf ein. Sie erwähnen es im Wesentlichen nur und verwenden dann weiterhin das multivariate Modell. Mathematisch werde ich zuerst die multivariate Version schreiben,
Um dies als die bekannte multiple lineare Regression neu zu parametrisieren, werden die Variablen einfach wie folgt umgeschrieben:
wobei die verwendeten Umparametrierungen , und . bedeutet, dass die Zeilen der Matrix Ende an Ende in einem langen Vektor angeordnet sind und das kronecker- oder äußere Produkt ist.
Wenn dies so einfach ist, warum sollten Sie dann Bücher über multivariate Modelle schreiben, Statistiken für diese Modelle testen usw.? Am effektivsten ist es, zuerst die Variablen zu transformieren und übliche univariate Techniken zu verwenden. Ich bin mir sicher, dass es einen guten Grund gibt. Es fällt mir nur schwer, darüber nachzudenken, zumindest im Fall eines linearen Modells. Gibt es Situationen mit dem multivariaten linearen Modell und normalverteilten Zufallsfehlern, in denen diese Neuparametrisierung nicht angewendet wird, oder die die Analysemöglichkeiten einschränken, die Sie durchführen können?
Quellen, die ich gesehen habe: Marden - Multivariate Statistik: Old School. Siehe Abschnitte 5.3 - 5.5. Das Buch ist kostenlos erhältlich unter: http://istics.net/stat/
Gelman et al. - Bayesianische Datenanalyse. Ich habe die zweite Ausgabe, und in dieser Version gibt es einen kleinen Absatz in Kap. 19 'Multivariate Regressionsmodelle' mit dem Titel: "Das äquivalente univariate Regressionsmodell"
Können Sie im Grunde alles mit dem äquivalenten linearen univariaten Regressionsmodell machen, das Sie mit dem multivariaten Modell machen könnten? Wenn ja, warum überhaupt Methoden für multivariate lineare Modelle entwickeln?
Was ist mit Bayes'schen Ansätzen?
Antworten:
Ich glaube die Antwort ist nein.
Wenn Ihr Ziel einfach darin besteht, entweder die Auswirkungen abzuschätzen (Parameter in ) oder auf der Grundlage des Modells weitere Vorhersagen zu treffen, spielt es ja keine Rolle, welche Modellformulierung zwischen den beiden besteht.B
Um jedoch statistische Rückschlüsse zu ziehen, insbesondere um die klassischen Signifikanztests durchzuführen, erscheint die multivariate Formulierung praktisch unersetzbar. Lassen Sie mich genauer die typische Datenanalyse in der Psychologie als Beispiel nehmen. Die Daten von Probanden werden ausgedrückt alsn
Mit der obigen Formulierung kann jede allgemeine lineare Hypothese leicht ausgedrückt werden als
Die Schönheit des multivariaten Systems liegt in seiner Trennung zwischen den beiden Arten von Variablen, zwischen und innerhalb des Subjekts. Es ist diese Trennung, die die einfache Formulierung für drei Arten von Signifikanztests unter dem multivariaten Rahmen ermöglicht: das klassische multivariate Testen, das multivariate Testen mit wiederholten Messungen und das univariate Testen mit wiederholten Messungen. Darüber hinaus sind Mauchly-Tests auf Sphärizitätsverletzungen und die entsprechenden Korrekturmethoden (Greenhouse-Geisser und Huynh-Feldt) auch für univariate Tests im multivariaten System eine Selbstverständlichkeit. Genau so haben die Statistikpakete diese Tests implementiert, z. B. Auto in R, GLM in IBM SPSS Statistics und REPEATED-Anweisung in PROC GLM von SAS.
Ich bin mir nicht sicher, ob die Formulierung für die Bayes'sche Datenanalyse von Bedeutung ist, bezweifle jedoch, dass die oben genannte Testfähigkeit unter der univariaten Plattform formuliert und implementiert werden könnte.
quelle
Beide Modelle sind gleichwertig, wenn Sie eine geeignete Varianz-Kovarianz-Struktur verwenden. In einem transformierten linearen Modell müssen wir die Varianz-Kovarianz-Matrix der Fehlerkomponente an das kronecker-Produkt anpassen, das in der verfügbaren Computersoftware nur begrenzt verfügbar ist. Die lineare Modelltheorie mit univariaten, multivariaten und gemischten Modellen ist eine hervorragende Referenz für dieses Thema.
Bearbeitet
Hier ist eine weitere nette Referenz frei verfügbar.
quelle