Wenn ich zwei Listen A und B habe, die beide Teilmengen einer viel größeren Liste C sind, wie kann ich feststellen, ob der Grad der Überlappung von A und B größer ist, als ich zufällig erwarten würde?
Sollte ich nur zufällig Elemente aus C mit den gleichen Längen wie die Listen A und B auswählen und diese zufällige Überlappung bestimmen und dies viele Male tun, um eine Art oder einen empirischen p-Wert zu bestimmen? Gibt es einen besseren Weg, dies zu testen?
statistical-significance
Eintopf
quelle
quelle
Antworten:
Um einen p-Wert zu berechnen, können Sie diesen R-Befehl verwenden:
Wort der Vorsicht. Denken Sie an mehrere Tests, dh wenn Sie viele A- und B- Listen haben, müssen Sie Ihre p-Werte mit einer Korrektur anpassen. Zum Beispiel die FDR- oder Bonferroni-Korrekturen.
quelle
Die Antwort von csgillespie scheint bis auf eines richtig zu sein: Sie gibt die Wahrscheinlichkeit an, in der Überlappung P (x> n_A_B) streng mehr als n_A_B zu sehen, aber ich denke, OP möchte den p-Wert P (x> = n_A_B). Sie könnten Letzteres durch bekommen
quelle
lower.tail=FALSE
. Ansonsten werden sehr kleine p-Werte (<1e-16) abgeschnitten.