Fisher Test in R.

10

Angenommen, wir haben den folgenden Datensatz:

                Men    Women    
Dieting         10      30
Non-dieting     5       60

Wenn ich den Fisher-Exakt-Test in R durchführe, was bedeutet dann alternative = greater(oder weniger)? Beispielsweise:

mat = matrix(c(10,5,30,60), 2,2)
fisher.test(mat, alternative="greater")

Ich bekomme das p-value = 0.01588und odds ratio = 3.943534. Wenn ich die Zeilen der Kontingenztabelle wie folgt umblättere:

mat = matrix(c(5,10,60,30), 2, 2)
fisher.test(mat, alternative="greater")

dann bekomme ich das p-value = 0.9967und odds ratio = 0.2535796. Wenn ich jedoch die Tabelle mit zwei Kontingenzen ohne das alternative Argument (dh fisher.test(mat)) ausführe, erhalte ich die p-value = 0.02063.

  1. Könnten Sie mir bitte den Grund erklären?
  2. Was ist in den oben genannten Fällen die Nullhypothese und die Alternativhypothese?
  3. Kann ich den Fischertest auf einer Kontingenztabelle wie dieser durchführen:

    mat = matrix(c(5000,10000,69999,39999), 2, 2)

PS: Ich bin kein Statistiker. Ich versuche Statistiken zu lernen, daher wäre Ihre Hilfe (Antworten in einfachem Englisch) sehr dankbar.

schnappen
quelle

Antworten:

11

greater(oder less) bezieht sich auf einen einseitigen Test, bei dem eine Nullhypothese p1=p2mit der Alternative p1>p2(oder p1<p2) verglichen wird . Im Gegensatz dazu vergleicht ein zweiseitiger Test die Nullhypothesen mit der Alternative, p1die nicht gleich ist p2.

Für Ihre Tabelle beträgt der Anteil männlicher Diätetiker in Ihrer Stichprobe 1/4 = 0,25 (10 von 40). Andererseits beträgt der Anteil männlicher Nicht-Diätetiker 1/13 oder (5 von 65) 0,077 in der Stichprobe. Die Schätzung für p1ist also 0,25 und für p2ist 0,077. Daher scheint es, dass p1>p2.

Deshalb beträgt p1>p2der p-Wert für die einseitige Alternative 0,01588. (Kleine p-Werte zeigen an, dass die Nullhypothese unwahrscheinlich und die Alternative wahrscheinlich ist.)

Wenn die Alternative ist p1<p2, sehen wir, dass Ihre Daten darauf hinweisen, dass der Unterschied in die falsche (oder unerwartete) Richtung geht.

Deshalb ist in diesem Fall der p-Wert so hoch 0,9967. Für die zweiseitige Alternative sollte der p-Wert etwas höher sein als für die einseitige Alternative p1>p2. Und tatsächlich ist es mit einem p-Wert von 0,02063.

Michael R. Chernick
quelle
Fantastische Erklärung. Der Fisher-Exact-Test vergleicht also tatsächlich die Wahrscheinlichkeiten zwischen Zeilen und nicht zwischen Spalten?
Christian