Ich habe ein Experiment durchgeführt, um die Reaktion einer Hefe (die 5000 Gene enthält) auf durch Hitzeschock verursachten Stress zu untersuchen. Ich habe eine Liste von 48 Genen, die bei 37 ° C überexprimiert werden, und eine andere Liste von 145 Genen, die bei 42 ° C überexprimiert werden. Es gibt 38 Gene, die in beiden überexprimiert sind.
Durch Zufall habe ich erwartet, dass nur 1 Gen in beiden überexprimiert ist. Wie kann ich berechnen, ob die Überlappung, die ich erhalten habe, signifikant ist? Wie kann ich den Wert erhalten? Ich weiß nichts über biostatistische oder mathematische Software. Vielen Dank!!! Jede Hilfe wird sehr willkommen sein :)
Antworten:
Der Tisch sieht so aus
Ja und Nein beziehen sich auf Fälle, die überexprimiert wurden oder nicht. Ich habe den genauen Fisher-Test in SAS ausgeführt. Die Ausgabe wird unten eingefügt:
Sie sehen hier, dass der p-Wert für den Fisher's Exact-Test sehr klein ist und weit unter 0,0001 liegt.
Dies zeigt genau, was Sie angegeben haben, dass die beobachteten 38, die bei beiden Temperaturen überexprimiert wurden, weitaus größer sind als das, was Sie unter Unabhängigkeit erwarten, was, wie Sie angegeben haben, 1,296 betragen würde.
quelle
Der genaue Test, auf den sich Michael bezieht, ist wahrscheinlich die Art und Weise, die ich zur Lösung des Problems empfehlen würde (wenige Annahmen). Als Referenz, würde der entsprechende gemeinsame statistische Test sein Test der Unabhängigkeit .χ2
quelle