Phylogenetisch abhängige Variablen: ANOVA?

13

Ich verstehe, eine Kovarianzmatrix aus phylogenetischen Daten abzuleiten, um für zwei Variablen zu erhalten, für die Sie eine Regression durchführen. Aber was passiert, wenn Sie eine kontinuierliche Variable haben, von der Sie zuvor gezeigt haben, dass sie von der Phylogenie abhängig ist, und eine ordinale Variable? Da letzteres eine Ordnungszahl ist, bin ich mir nicht sicher, wie ich dies mit der Art und Weise in Verbindung bringen soll, in der die phylogenetische Abhängigkeit zu voreingenommenen Teststatistiken führt.cov(X,Y)=0

Ist es sinnvoll, Felsensteins phylogenetische unabhängige Kontraste für Ihre stetige Variable zu berechnen und diese für Ihre ANOVA zu verwenden?

Der PIC-Wert ist:

Cij=(XiXj)dij

Wo ist , X für Spezies i , X j ist , X für Arten , j und d i j der Abstand zwischen paarweisen Spezies i und j auf dem phylogenetischen Baum.XiXi,XjXjdijij

user1134516
quelle
1
Bei CrossValidated gibt es genügend angewandte Statistiker, die möglicherweise in Betracht gezogen werden könnten, diese auf die Statistik-Site zu migrieren.
Daniel Standage
2
Ich würde die r-sig-phylo Mailingliste empfehlen ( stat.ethz.ch/mailman/listinfo/r-sig-phylo ). Auch wenn Sie R nicht für Ihre Analyse verwenden, erhalten Sie sehr gute Antworten auf Ihre Frage.
kmm

Antworten:

1

Als ersten Schritt würde ich empfehlen, eine Dummy-Variable für jede der Ordinalklassen einzuführen (siehe Kommentare unter https://www.google.com/url?sa=t&source=web&rct=j&ei=B9r5U67pH8vfsASwq4GADQ&url=http://www.uta .edu / faculty / kunovich / Soci5304_Handouts / Topic% 25208_Dummy% 2520Variables.doc & cd = 2 & ved = 0CCAQFjAB & usg = AFQjCNEX-TD7RjSYZ-ej32_5tgPTxVdvQ & sigg2 . Sie können auch die Dummy-Variablen selbst auf einen Trend prüfen. Sie können auch die Ordinalvariablenkategorie für die nachfolgende Analyse nach der jeweils geschätzten Größe der Dummy-Variablen neu anordnen, wenn eine vorherige (vor dem Anzeigen der aktuellen Daten) Begründung dafür vorliegt.

Vorausgesetzt, der vorherigen Analyse fehlt ein zunehmender (nicht notwendigerweise linearer) Trendeffekt, und die Einbeziehung einer unterstützbaren Reihenfolge in die Ordnungsvariable selbst, ein interessanter Ansatz, der auch mögliche Normalitätsprobleme berücksichtigt, besteht darin, eine Regressionsanalyse durchzuführen, bei der allen Variablen Ränge zugewiesen werden. einschließlich der Ordnungszahl. Eine Begründung für diesen Wahnsinn, um aus Wikipedia über den Rangkorrelationskoeffizienten von Spearman zu zitieren (Link: http://en.m.wikipedia.org/wiki/Spearman) 's_rank_correlation_coefficient):

"Der Spearman-Koeffizient eignet sich wie jede Korrelationsberechnung sowohl für kontinuierliche als auch für diskrete Variablen, einschließlich Ordinalvariablen. [1] [2]

Wikipedia bietet ein Beispiel und verschiedene Möglichkeiten, um den Standardfehler der berechneten Rangkorrelation zu Testzwecken zu bewerten. Beachten Sie, dass eine skalierte Version, wie bei einer auf Rängen basierenden berechneten Regression, in ähnlicher Weise nicht signifikant ist, wenn sie sich statistisch nicht von Null unterscheidet.

Ich würde diese Ränge weiter normalisieren (dividiert durch die Anzahl der Beobachtungen), um eine mögliche Interpretation des Stichprobenquantils zu erhalten (beachten Sie, dass es bei der Konstruktion der empirischen Verteilung für die fraglichen Daten mögliche Verfeinerungen gibt). Ich würde auch eine einfache Korrelation zwischen y und einer gegebenen transformierten Ordinalvariablen durchführen, so dass die Richtung Ihres ausgewählten Rankings (z. B. 1 zu 4 versus 4 zu 1) ein Vorzeichen für die Rangkorrelation ergibt, das im Kontext eine intuitive Bedeutung hat Ihrer Studie.

[Bearbeiten] Bitte beachten Sie, dass ANOVA-Modelle im Regressionsformat mit der entsprechenden Entwurfsmatrix dargestellt werden können. Unabhängig davon, welches Standard-Regressionsmodell Sie untersuchen, ist das zentrale Thema eine auf dem Mittelwert basierende Analyse von Y mit gegebenem X. In einigen Disziplinen wie Ökologie, Ein anderer Fokus auf Regressionsbeziehungen, die bei verschiedenen Quantilen impliziert werden, einschließlich des Medians, hat sich als fruchtbar erwiesen. Offensichtlich können in der Ökologie mittlere Effekte gering sein, aber nicht unbedingt bei anderen Quantilen. Dieses Feld wird als Quantilregression bezeichnet. Ich würde vorschlagen, dass Sie es verwenden, um Ihre aktuelle Analyse zu ergänzen. Als Referenz finden Sie möglicherweise Artikel 213-30, "Eine Einführung in die Quantile Regression und das QUANTREG-Verfahren" von Colin (Lin) Chen vom SAS Institute, hilfreich.

Hier ist auch eine Quelle zur Verwendung von Rangtransformationen: "Die Verwendung von Rangtransformationen in der Regression" von Ronald L. Iman und WJ Conover, veröffentlicht in Technometrics, Band 21, Nr. 4, November 1979. Der Artikel stellt fest, dass Regressionen auftreten Die Verwendung von Rangtransformationen scheint bei monotonen Daten recht gut zu funktionieren. Diese Meinung wird auch von Zuverlässigkeitsfachleuten geteilt, die in einem Online-Magazin zitieren: "Die Methode zur Schätzung der Rangregression ist ziemlich gut für Funktionen, die linearisiert werden können". Quelle: "Reliability Hotwire, Ausgabe 10, Dezember 2010.

Ajkoer
quelle
Ein anonymer Benutzer hat versucht, Ihren Post ziemlich umfangreich (IMO) zu bearbeiten. Wenn Sie mit ihnen nicht einverstanden sind, können Sie sie zurücksetzen, indem Sie auf den Link "Vor __ bearbeitet" klicken, die von Ihnen bevorzugte Version suchen und auf "Zurücksetzen" klicken.
gung - Wiedereinsetzung von Monica
0

Ein phylogenetischer ANOVA-Test wurde von Garland et al. (1993) und ist in der phy.anovaFunktion im geigerPaket implementiert . Das Verfahren erzeugt p-Werte, die hinsichtlich der phylogenetischen Nichtunabhängigkeit korrigiert sind, indem eine Nullverteilung erzeugt wird, die auf der Simulation der Evolution der Phylogenie basiert.

Langsame Loris
quelle