Wie interpretiere und berichte ich eta squared / partial eta squared in statistisch signifikanten und nicht signifikanten Analysen?

39

Ich habe Daten, die eta-Quadrat-Werte und partielle eta-Quadrat-Werte haben, die als Maß für die Effektgröße für Gruppenmittelwertdifferenzen berechnet wurden.

  • Was ist der Unterschied zwischen eta im Quadrat und partiellem eta im Quadrat? Können beide nach den gleichen Cohen-Richtlinien interpretiert werden (1988, denke ich: 0,01 = klein, 0,06 = mittel, 0,13 = groß)?

  • Gibt es auch eine Verwendung für die Berichterstattung der Effektgröße, wenn der Vergleichstest (dh t-Test oder Einweg-ANOVA) nicht signifikant ist? In meinem Kopf ist dies so, als würde ich sagen: "Der mittlere Unterschied hat keine statistische Signifikanz erreicht, ist aber immer noch von besonderer Bedeutung, da die vom eTA-Quadrat angegebene Effektgröße mittel ist." Oder ist die Effektgröße eher ein Ersatzwert für Signifikanztests als eine Ergänzung?

Kurze Elizabeth
quelle
Tatsächlich berechnet SPSS für alle ANOVAs partielle eta-Quadrate. Dies ergibt den gleichen Wert wie das eta-Quadrat in einzelnen IV-Entwürfen für unabhängige Gruppen, jedoch einen anderen Wert in einzelnen IV-Entwürfen für wiederholte Messungen. Das bereitet meinen Schülern keine Probleme.

Antworten:

43

Effektgrößen für Gruppenmittelwertunterschiede

  • Im Allgemeinen finde ich standardisierte Gruppenmitteldifferenzen (z. B. Cohens d) ein aussagekräftigeres Effektgrößenmaß im Kontext von Gruppenunterschieden. Maße wie das ETA-Quadrat werden davon beeinflusst, ob die Gruppenprobengrößen gleich sind, während Cohens d dies nicht ist. Ich denke auch, dass die Bedeutung von d-basierten Maßen intuitiver ist, wenn Sie versuchen, einen Unterschied zwischen Gruppenmitteln zu quantifizieren.
  • f2
  • Eine dritte Option besteht darin, dass im Kontext von experimentellen Effekten, selbst wenn es mehr als zwei Gruppen gibt, das Konzept des Effekts am besten als binärer Vergleich (dh der Effekt einer Bedingung relativ zu einer anderen) konzipiert werden kann. In diesem Fall können Sie wieder zu d-basierten Kennzahlen zurückkehren. Das d-basierte Maß ist kein Effektgrößenmaß für den Faktor, sondern eine Gruppe relativ zu einer Referenzgruppe. Der Schlüssel besteht darin, eine aussagekräftige Referenzgruppe zu definieren.
  • Schließlich ist es wichtig, sich an das umfassendere Ziel zu erinnern, Größenmaße für Effekte aufzunehmen. Es soll dem Leser einen Eindruck von der Größe des interessierenden Effekts vermitteln. Jedes standardisierte Wirkungsmaß sollte den Leser bei dieser Aufgabe unterstützen. Wenn sich die abhängige Variable auf einer inhärent aussagekräftigen Skala befindet, scheuen Sie sich nicht, die Größe des Effekts in Bezug auf diese Skala zu interpretieren. ZB sind Maßstäbe wie Reaktionszeit, Gehalt, Größe, Gewicht usw. von Natur aus sinnvoll. Wenn Sie, wie ich es tue, feststellen, dass eta squared im Kontext von experimentellen Effekten etwas uninteressant ist, wählen Sie möglicherweise einen anderen Index.

Eta im Quadrat versus partielles Eta im Quadrat

  • Das partielle ETA-Quadrat ist das Standardmaß für die Effektgröße, das in mehreren ANOVA-Verfahren in SPSS angegeben wird. Ich gehe davon aus, dass ich deswegen häufig Fragen dazu bekomme.
  • Wenn Sie nur eine Prädiktorvariable haben, entspricht das partielle ETA-Quadrat dem ETA-Quadrat.
  • Dieser Artikel erklärt den Unterschied zwischen eta im Quadrat und partiellem eta im Quadrat (Levine und Hullett, eta im Quadrat, partielles eta im Quadrat ).
  • Wenn Sie mehr als einen Prädiktor haben, ist partielles eta im Quadrat die Varianz, die durch eine gegebene Variable der Varianz erklärt wird, die nach dem Ausschließen der von anderen Prädiktoren erklärten Varianz verbleibt.

Faustregeln für eta im Quadrat und partielles eta im Quadrat

  • Wenn Sie nur einen Prädiktor haben, sind eta squared und partial eta squared gleich und daher gelten die gleichen Faustregeln.
  • Wenn Sie mehr als einen Prädiktor haben, dann sind die allgemeinen Faustregeln für eta squared meines Erachtens eher für eta squared als für eta squared anwendbar. Dies ist darauf zurückzuführen, dass das partielle Eta-Quadrat in der faktoriellen ANOVA wahrscheinlich näher an das heranreicht, was das Eta-Quadrat für den Faktor gewesen wäre, wenn es eine Einweg-ANOVA gewesen wäre. und es ist vermutlich eine Einweg-ANOVA, aus der Cohens Faustregeln hervorgingen. Im Allgemeinen sollte das Einbeziehen anderer Faktoren in ein experimentelles Design typischerweise das eta-Quadrat reduzieren, aber nicht unbedingt das partielle eta-Quadrat, da der zweite Faktor, falls er eine Auswirkung hat, die Variabilität in der abhängigen Variablen erhöht.
  • Trotz meiner Aussagen zu Daumenregeln für eta squared und partielles eta squared bekräftige ich, dass ich kein Fan von Varianz erklärter Maße der Effektgröße im Kontext der Interpretation der Größe und Bedeutung experimenteller Effekte bin. Ebenso sind Faustregeln genau das, grob, kontextabhängig und nicht zu ernst zu nehmen.

Größe des Berichterstattungseffekts im Kontext signifikanter und nicht signifikanter Ergebnisse

  • In gewissem Sinne besteht ein Ziel Ihrer Forschung darin, verschiedene quantitative Schätzungen der Auswirkungen Ihrer interessierenden Variablen auf die Bevölkerung abzuschätzen.
  • Effektgrößen sind eine Quantifizierung einer Punktschätzung dieses Effekts. Je größer Ihre Stichprobengröße ist, desto näher kommt Ihre Stichprobenpunktschätzung im Allgemeinen dem tatsächlichen Grundgesamtheitseffekt.
  • Im Allgemeinen sollen Signifikanztests den Zufall als Erklärung für Ihre Ergebnisse ausschließen. Somit gibt der p-Wert die Wahrscheinlichkeit an, eine Effektgröße als oder extremer zu beobachten, wenn die Nullhypothese wahr ist.
  • Letztendlich möchten Sie keinen Effekt ausschließen und etwas über die Größe des tatsächlichen Populationseffekts sagen. Konfidenzintervalle und Glaubwürdigkeitsintervalle in Bezug auf die Effektgrößen sind zwei Ansätze, die direkter auf dieses Problem eingehen. Das Melden von p-Werten und Punktschätzungen der Effektgröße ist jedoch weit verbreitet und viel besser als das Melden nur von p-Werten oder nur von Effektgrößenmaßen.
  • In Bezug auf Ihre spezifische Frage, ob Sie nicht signifikante Ergebnisse haben, ist es Ihre Entscheidung, ob Sie Effektgrößenmessungen melden. Ich denke, wenn Sie eine Tabelle mit vielen Ergebnissen haben, ist es sinnvoll, eine Effektgrößenspalte zu verwenden, die unabhängig von der Signifikanz verwendet wird. Auch in nicht signifikanten Kontexten können Effektgrößen mit Konfidenzintervallen aussagekräftig sein, um anzuzeigen, ob die nicht signifikanten Ergebnisse auf eine unzureichende Stichprobengröße zurückzuführen sind.
Jeromy Anglim
quelle
1
Hallo Jeremy, ich unterscheide mich von dir, wenn du sagst, dass "partielles Eta-Quadrat in faktorieller ANOVA wohl näher an das heranreicht, was eta-Quadrat für den Faktor gewesen wäre, wenn es eine Einweg-ANOVA gewesen wäre." Tatsächlich ist das eta-Quadrat, wenn der Prädiktor alleine verwendet wird, wahrscheinlich viel größer als das partielle eta-Quadrat in der Gesellschaft anderer Prädiktoren. Im letzteren Fall wird die im Ergebnis erläuterte geteilte Varianz dem fraglichen Prädiktor nicht gutgeschrieben. Im ersten Fall gibt es keinen "Wettbewerb" um die erklärten Abweichungen, sodass der Prädiktor für jede Überschneidung mit dem Ergebnis eine Gutschrift erhält.
Rolando2
3
@ rolando2 Vielleicht war mein Punkt mehrdeutig. Ich beziehe mich auf geplante Experimente. Angenommen, Experiment 1 manipuliert Faktor A und Experiment 2 A und B. Unter der Annahme eines ausgeglichenen Designs sind beide Faktoren orthogonal. Unter der Annahme, dass beide Faktoren die Varianz erklären, ist die Varianz, die durch den Faktor A in Experiment 2 erklärt wird, geringer als in Experiment 1, in dem das Niveau des Faktors B konstant gehalten wird. Wenn man also faktorielle Experimente mit Experimenten mit einem Faktor vergleicht, denke ich, dass partielles eta im Quadrat zwischen Experimenten mit faktoriellen Experimenten und Experimenten mit einem Faktor ähnlicher ist, insbesondere wenn es keinen Wechselwirkungseffekt gibt.
Jeromy Anglim