Ich analysiere einen Datensatz über Gezeitengemeinschaften. Die Daten beziehen sich auf die prozentuale Abdeckung (von Seetang, Seepocken, Muscheln usw.) in Quadraten. Ich bin zu Denken über Korrespondenzanalyse (CA) in Bezug auf die Arten verwendet zählt, und Hauptkomponentenanalyse (PCA) als etwas nützlicher für lineare Umwelt (nicht Spezies) Trends. Ich hatte nicht wirklich Glück herauszufinden, ob PCA oder CA besser für die prozentuale Deckung geeignet sind (ich kann keine Papiere finden), und ich bin mir nicht einmal sicher, wie etwas, das auf 100% begrenzt ist, verteilt wird ?
Ich bin mit der groben Richtlinie vertraut, dass Sie davon ausgehen können, dass CA verwendet werden sollte, wenn die Länge der ersten DCA-Achse (Detrended Correspondence Analysis) größer als 2 ist. Die Länge der DCA-Achse 1 betrug 2,17, was ich nicht hilfreich finde.
quelle
Antworten:
PCA arbeitet mit den Werten, während CA mit den relativen Werten arbeitet. Beide eignen sich gut für Daten zur relativen Häufigkeit der von Ihnen genannten Art (mit einer großen Einschränkung, siehe später). Mit% data haben Sie bereits ein relatives Maß, aber es gibt immer noch Unterschiede. Frag dich selbst
Wenn erstere, verwenden Sie PCA. Wenn letztere CA verwenden. Was ich mit den beiden Fragen meine, ist, würden Sie wollen
als unterschiedlich oder gleich angesehen werden?
A
undB
sind zwei Stichproben und die Werte sind die prozentuale Abdeckung von drei gezeigten Taxa. (Dieses Beispiel hat sich als schlecht herausgestellt, vorausgesetzt, es gibt nackten Boden! ;-) PCA würde diese aufgrund des verwendeten euklidischen Abstands als sehr unterschiedlich betrachten, aber CA würde diese beiden Proben als sehr ähnlich betrachten, da sie das gleiche relative Profil haben.Die große Einschränkung hierbei ist die geschlossene Zusammensetzung der Daten. Wenn Sie einige Gruppen haben (z. B. Sand, Schlick, Ton), die sich zu 1 (100%) summieren, ist keiner der beiden Ansätze korrekt, und Sie können über Aitchisons Log-Ratio-PCA, die für geschlossene Kompositionen entwickelt wurde, zu einer angemesseneren Analyse übergehen Daten. (IIRC, um dies zu tun, müssen Sie nach Zeilen und Spalten zentrieren und die Daten protokollieren.) Es gibt auch andere Ansätze. Wenn Sie R verwenden, dann ein Buch , das wäre sinnvoll ist , wird analysiert Kompositorische Daten mit R .
quelle