Welcher statistische Test sollte verwendet werden, um die Anreicherung von Genlisten zu testen?

10

Ich habe ein Experiment durchgeführt, um die zelluläre Empfindlichkeit gegenüber einem bestimmten DNA-Schadensmittel zu testen. Wir haben 270 Gene gefunden, die spezifisch für das Arzneimittel empfindlich waren, und die Gesamtzahl der analysierten Gene betrug 3668. 38 der 270 empfindlichen Gene werden als "DNA-Reparaturgene" klassifiziert. Wenn die Anzahl der im Genom enthaltenen "DNA-Reparaturgene" 112 und die Gesamtzahl der Gene im Genom 3668 beträgt, sind die empfindlichen Gene in DNA-Reparaturgenen angereichert? Welcher statistische Test sollte verwendet werden? Ich würde mich freuen, wenn Sie mir auch ein Tool zur Online-Berechnung des p-Werts nennen könnten.

Laura
quelle

Antworten:

17

Die Standardpraxis zum Testen der Anreicherung von Genlisten besteht darin, einen hypergeometrischen Test oder gleichwertig einen einseitigen exakten Fisher-Test durchzuführen . Sie haben die folgende Kontingenztabelle:2×2

DNA RepairOtherSensitive38232270Not Sensitive74332433981123556

Sie können den Test Rwie folgt durchführen:

fisher.test(matrix(c(38,74,232,3324),nrow=2,ncol=2),alternative="greater")

Welches ergibt ein sehr signifikantes Ergebnis:

Fisher's Exact Test for Count Data

data:  matrix(c(38, 74, 232, 3324), nrow = 2, ncol = 2) 
p-value < 2.2e-16
alternative hypothesis: true odds ratio is greater than 1 
95 percent confidence interval:
5.062107      Inf 
sample estimates:
odds ratio 
7.34918

Beachten Sie, dass beim Testen auf Überrepräsentation (und nicht auf Unterrepräsentation) der alternativeParameter auf gesetzt ist "greater".

M. Berk
quelle
1
Vielen Dank für Ihre Antwort. Ich dachte auch, dass der Fisher´exact Test eine gute Methode für die Analyse sein könnte. Ich habe keine Statistiksoftware, um die Ergebnisse für andere Funktionsklassen durchzuführen, die ich auch testen möchte. Kennen Sie ein "Online" -Tool, um die p-Werte mit allen Dezimalstellen zu erhalten?
Laura
1
Sie können R kostenlos herunterladen. Siehe r-project.org Es ist also lösbar , keine Software zu haben (und zu denken, dass Sie eine Methode zur Online-Berechnung benötigen, ist falsch). Aber bitte suchen Sie ein wenig, um diese Dinge selbst herauszufinden. Siehe Beratung bei stats.stackexchange.com/help/how-to-ask auf eine gute Frage zu stellen.
Nick Cox
@Nick Dein Rat ist gut, aber bitte formuliere ihn nicht als Charakterisierung des Plakats: Eine solche Formulierung wird allzu leicht als Angriff missverstanden, was ich bezweifle, dass du beabsichtigt hast. Deshalb habe ich den vorläufigen Satz in Ihrem Kommentar entfernt (der keine Informationen hinzugefügt hat).
whuber
Ein großartiges Online-Tool dafür ist: mathcelebrity.com/fishers_exact_test.php
Könnten Sie bitte zusätzlich erklären, Überrepräsentation dessen, was genau berechnet wird?
sdgaw erzswer