Frage : Wie kann ich einen Test erstellen, um festzustellen, ob die beobachtete "Berg" -Allele-Frequenz (Abb. 1) im mittleren bis südlichen Gebirge signifikant niedriger ist als vom ökologischen Auswahlmodell vorhergesagt (Abb. 2) ( Einzelheiten siehe unten )?
Problem : Mein erster Gedanke war, die Modellreste gegen Breite: Länge und Höhe zu regressieren (was nur dazu führt, dass die Wechselwirkung zwischen Breite und Länge als signifikant gilt). Das Problem ist, dass die Residuen (Abb. 3) Variationen widerspiegeln können, die nicht durch das Modell erklärt wurden, und / oder dass etwas biologisches passiert, z. B. hatte das Allel keine Zeit, sich nach Süden zu seinem Potenzial auszubreiten, oder es gibt eine Barriere für den Genfluss. Wenn Sie die beobachteten (Abb. 1) mit den erwarteten (Abb. 2) Gebirgsallelfrequenzen vergleichen, gibt es einen offensichtlichen Unterschied, insbesondere in den zentralen und südlichen Bergen Schwedens und Norwegens. Ich akzeptiere, dass das Modell möglicherweise nicht alle Variationen erklärt, aber kann ich einen vernünftigen Test finden, um die Idee zu untersuchen, dass das Berg-Allel sein Potenzial in den zentralen bis südlichen Bergen nicht erreicht hat?
Hintergrund: Ich habe einen bi-allelischen AFLP-Marker, dessen Häufigkeitsverteilung mit dem Lebensraum der Berge (und Breiten- und Längengrade) im Vergleich zu den Lebensräumen im Tiefland auf der skandinavischen Halbinsel in Zusammenhang zu stehen scheint (Abb. 1). Die "Berg" -Allele ist im Norden, der bergig ist, fast fixiert. Es fehlt fast oder ist für das "Tiefland" -Allele im Süden, dem Berge fehlen, fixiert. Wenn man sich in den Bergen von Norden nach Süden bewegt, tritt die "Berg" -Allele in geringerer Häufigkeit auf. Dieser Unterschied in der "Berg" -Allele-Frequenz von Nord nach Süd kann einfach auf Phylogeographie oder historische Prozesse zurückzuführen sein, da die Region sowohl von Norden als auch von Süden kolonisiert wurde. Wenn das Berg-Allel beispielsweise aus der nördlichen Bevölkerung stammt, hatte es möglicherweise keine Zeit, sich vollständig auf die südliche Bevölkerung auszudehnen.
Meine Arbeitshypothese ist, dass die "Berg" -Allele-Frequenz ein Ergebnis der ökologischen Selektion ist (Nullhypothese ist neutrale Selektion).
Für mein ökologisches Auswahlmodell habe ich ein verallgemeinerte additives Modell (GAM) mit der binomischen Allel verwendet Frequenz als Reaktionsvariable (129 Standorte in Fennoscandinavia mit in der Regel 10 bis 20 Personen an jeder Stelle abgetastete) und mehrere Klima- und Vegetationsperiode Variablen wie die Prädiktorvariablen. Die Modellergebnisse sind wie folgt (TMAX04-06 = maximale Temperatur im April-Juni, Phen_NPPMN = mittlere Vegetationsproduktivität in der Vegetationsperiode, PET_HE_YR = jährliche potenzielle Evapotranspiration, Dist_Coast = Entfernung zur Küste):
Family: binomial
Link function: logit
Formula: Binomial_WW1 ~ s(TMAX_04) + s(TMAX_05) + s(TMAX_06) + s(Phen_NPPMN) +
s(PET_HE_YR) + s(Dist_Coast)
Parametric coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.74372 0.04736 -15.7 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Approximate significance of smooth terms:
edf Ref.df Chi.sq p-value
s(TMAX_04) 3.8100 4.812 25.729 9.43e-05 ***
s(TMAX_05) 0.8601 1.000 5.887 0.01526 *
s(TMAX_06) 0.8862 1.000 7.644 0.00569 **
s(Phen_NPPMN) 6.2177 7.375 39.028 3.16e-06 ***
s(PET_HE_YR) 3.1882 4.147 18.039 0.00145 **
s(Dist_Coast) 2.2882 2.857 9.725 0.01906 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
R-sq.(adj) = 0.909 Deviance explained = 89.7%
REML score = 326.73 Scale est. = 1 n = 129
Figure 1. Beobachtete "Berg" -Allelefrequenz für den bi-allelischen AFLP-Marker. Konturlinien 0,1 Frequenzintervalle, Farbschattierung ist Höhe mit Blau für niedrigste und Rot am höchsten.
Abbildung 2. Voraussichtliche "Berg" -Allelefrequenz für den bi-allelischen AFLP-Marker. Konturlinien 0,1 Frequenzintervalle, Farbschattierung ist Höhe mit Blau für niedrigste und Rot am höchsten.
Abbildung 3. Residuen des ökologischen Auswahlmodells (unter Verwendung von GAM), aufgeschlüsselt nach dem gesamten Untersuchungsgebiet (Fennoscandinavia) und getrennt nach Norwegen, Schweden und Finnland. Die roten gestrichelten Linien stellen eine sekundäre Kontaktzone zwischen der nördlichen und der südlichen Population dar, die aus anderen AFLP-Markern und der Stabilisotopenanalyse von Federn abgeleitet wurde, die auf ihren separaten Überwinterungsgebieten in Afrika gezüchtet wurden. Die dünne schwarz gepunktete Linie ist das Zentrum der Zone.
quelle
Antworten:
Diese Frage mag tot sein, aber die Grafiken hier sind großartig, und die Antwort hier fühlt sich intuitiv offensichtlich an. Wenn Sie nach einem "Berg" -Allel suchen, ist es naheliegend, die Höhe (oder einen Ersatz davon) als Prädiktor zu verwenden. Wenn dies einen signifikanten Zusammenhang mit der Allelfrequenz zeigt, würde dies einen starken Beweis für Ihre Hypothese liefern.
Sie können mehr Prädiktorvariablen hinzufügen, die andere Aspekte des Berges als seine Höhe beschreiben - zum Beispiel die "Rauheit" des Geländes oder den Vegetationstyp -, die einzigartig bergig sind und auch mit der Allelfrequenz verbunden sein können.
quelle