Ich mache eine lineare Regression für Kompositionsdaten unter Verwendung der Log-Ratio-Transformation mit Volkszählungsdaten. Die IVs sind zusammengesetzt (Prozent summiert sich auf 100). Der DV ist nicht kompositorisch und kontinuierlich.
Die alr- und clr-Ergebnisse lassen sich leichter interpretieren. Sie alle erzeugen das gleiche Maß an Passform. Ich bin geneigt, mit alr (oder clr) zu gehen. Aitchison charakterisiert ilr als den "reinen Mathematik" -Ansatz, aber mein Publikum besteht nicht aus Statistikern oder Mathematikern.
Wenn mein Ziel nur darin besteht, Erkenntnisse aus der Analyse zu vermitteln, warum sollte ich mich dann für den viel schwieriger zu interpretierenden ilr-Ansatz (mit Salden) entscheiden?
Ich habe jede Menge Nachforschungen von Aitchison, Juan Jose Egozcue und Vera Pawlosky-Glahn gelesen, aber nicht nach Debatten gesucht.
quelle
m - 1
?Es gibt ein Problem mit der clr () - Transformation. Nach der Transformation der Daten bleiben die gleichen Mengenvariablen erhalten, aber im Fall von clr () erhalten Sie singuläre Daten (tatsächlich erhalten Sie eine singuläre Kovarianzmatrix) :
y1 + ... yD = 0
. Und wie Sie vielleicht wissen, können einige statistische Analysen nicht für einzelne Daten durchgeführt werden. Die ilr () - Transformation reduziert die Anzahl Ihrer Variablen. Nehmen wir also an, Sie hatten einen D-dimensionalen Raum, aber nach ilr () erhalten Sie D-1. Infolgedessen sind Ihre transformierten Daten nichts weiter als Verhältnisse. Ich empfehle, dieses Papier hier zu lesen: http://is.muni.cz/do/rect/habilitace/1431/Hron/habilitace/15_Filzmoser_et_al__2010_.pdfquelle
Ich würde mit ALR gehen, da es sinnvoller ist. Sie verwenden eine Komponente als Basislinie oder Referenz und sehen dann, was die anderen in Bezug auf diese tun.
quelle