In einem Artikel, den ich geschrieben habe, modelliere ich die Zufallsvariablen und anstelle von und , um die Probleme effektiv zu beseitigen, die auftreten, wenn und stark korreliert sind und die gleiche Varianz aufweisen (wie in meiner Anwendung). Die Schiedsrichter möchten, dass ich einen Hinweis gebe. Ich könnte es leicht beweisen, aber als Anwendungsjournal bevorzugen sie einen Verweis auf eine einfache mathematische Ableitung.
Hat jemand Vorschläge für eine geeignete Referenz? Ich dachte, in Tukeys EDA-Buch (1977) steckt etwas über Summen und Unterschiede, aber ich kann es nicht finden.
correlation
multicollinearity
Rob Hyndman
quelle
quelle
Antworten:
Ich würde auf die lineare Regressionsanalyse von Seber GAF (1977) verweisen. Wiley, New York. Satz 1.4.
Dies sagtcov(AX,BY)=Acov(X,Y)B′ .
Nimm = (1 1) und B = (1 -1) und X = Y.A B X Y = Vektor mit deinem X und Y.
Beachten Sie, dass für wichtig ist , dass X und Y ähnliche Varianzen aufweisen. Wenn var ( X ) ≫ var ( Y ) ist , ist cov ( X + Y , X - Y ) groß.cov(X+Y,X−Y)≈0 var(X)≫var(Y) cov(X+Y,X−Y)
quelle