Der Welch-t-Test für ungleiche Varianzen (auch als Welch-Satterthwaite oder Welch-Aspin bekannt) weist im Allgemeinen nicht ganzzahlige Freiheitsgrade auf . Wie sollen diese Freiheitsgrade bei der Meldung der Testergebnisse angegeben werden?
"Es ist üblich, vor dem Abrufen von Standardtabellen auf die nächste ganze Zahl abzurunden", wie aus verschiedenen Quellen hervorgeht * - was sinnvoll ist, da diese Rundungsrichtung konservativ ist. ** Einige ältere Statistiksoftware würde dies ebenfalls tun (z. B. Graphpad Prism vor Version 6 ) und einige Online-Rechner noch. Wenn dieses Verfahren angewendet wurde, erscheint es angemessen , abgerundete Freiheitsgrade anzugeben. (Obwohl die Verwendung einer besseren Software möglicherweise noch angemessener ist!)
Die überwiegende Mehrheit der modernen Pakete verwendet jedoch den Bruchteil, so dass in diesem Fall der Bruchteil anscheinend in Anführungszeichen gesetzt werden sollte. Es erscheint mir nicht angebracht, mehr als zwei Dezimalstellen anzugeben, da ein Tausendstel Freiheitsgrad nur einen vernachlässigbaren Einfluss auf den p- Wert haben würde.
Wenn ich mich in Google Scholar umsehe, sehe ich Artikel, in denen der df als ganze Zahl mit einer Dezimalstelle oder mit zwei Dezimalstellen angegeben ist. Gibt es Richtlinien für die Genauigkeit der Verwendung? Wenn die Software den vollständigen Bruchteil verwendet, sollte der angeführte df auf die gewünschte Anzahl von Ziffern abgerundet werden (z. B. bis 1 dp oder als ganze Zahl), wie dies mit dem angemessen war konservative Rechnung, oder wie mir vernünftiger erscheint, konventionell ( auf den nächsten ) gerundet, so dass bis 1 dp oder auf das nächste Ganze?→ 7→ 8
Bearbeiten: Abgesehen davon, dass Sie die theoretisch fundierteste Methode zum Melden von nicht ganzzahligen df kennen, ist es auch gut zu wissen, was die Leute in der Praxis tun . Vermutlich haben Zeitschriften und Styleguides ihre eigenen Anforderungen. Ich wäre gespannt, was einflussreiche Styleguides wie die APA verlangen. Nach allem, was ich feststellen kann (ihr Handbuch ist online nicht frei verfügbar), hat der APA die allgemeine Präferenz, dass fast alles auf zwei Dezimalstellen erscheinen sollte, mit Ausnahme von p- Werten (die zwei oder drei dp sein können) und Prozentsätzen (auf das gerundet) nächster Prozentwert) - deckt Regressionssteigungen, t- Statistiken, F- Statistiken,Statistiken und so weiter. Dies ist ziemlich unlogisch, wenn man bedenkt, dass die zweite Dezimalstelle eine ganz andere signifikante Zahl einnimmt und eine ganz andere Genauigkeit vorschlägt als 982,47, könnte aber die Anzahl von Welch df mit zwei Dezimalstellen erklären, die ich in meiner unwissenschaftlichen Stichprobe gesehen habe .
zB Ruxton, GD Der t-Test mit ungleicher Varianz ist eine unterbewertete Alternative zum t-Test nach Student und zum Mann-Whitney-U-Test , Behavioral Ecology (Juli / August 2006) 17 (4): 688-690 doi: 10.1093 / beheco / ark016
wenn die Welch-Satterthwaite-Näherung selbst konservativ sein kann oder nicht und in einem Fall, in dem sie nicht konservativ ist, ist eine Abrundung der Freiheitsgrade keine Garantie für eine Kompensation insgesamt.
quelle
Antworten:
Ich habe die tatsächliche Praxis nicht studiert, daher kann diese Antwort diesen Aspekt der Frage nicht ansprechen. Generell würde ich erwarten, dass die Behandlung signifikanter Ziffern bei der Angabe der Freiheitsgrade (df) auf der Beurteilung signifikanter Zahlen beruht.
Das Prinzip ist, konsistent zu sein : Verwenden Sie die Genauigkeit in einer Größe, die für die Genauigkeit in einer anderen, die damit zusammenhängt, geeignet ist. Insbesondere, wenn die Werte und y = f ( x ) gemeldet werden, wenn x dem nächsten Vielfachen eines kleinen Werts h (wie h = 1) gegeben wirdx y=f(x) x h für sechs Nachkommastellen) ist die relative Genauigkeit iny,wie sie durch die Funktionf vermitteltwirdh=12×10−6 y f
Die Näherung gilt, wenn im Intervall stetig differenzierbar ist .[ x - h , x + h ]f [x−h,x+h]
In der vorliegenden Anmeldung ist der Wert, die Freiheitsgrade undp x νy p x ν
Dabei ist die Welch-Satterthwaite-Statistik und die CDF der Student Verteilung mit Freiheitsgraden.F ν t νt Fν t ν
Bei relativ hohen df ändert eine Änderung der ersten Dezimalstelle häufig den p-Wert überhaupt nicht (auf das angegebene Genauigkeitsniveau), daher ist das Runden auf eine ganze Zahl in Ordnung ( aber ist sehr klein). Für sehr niedrige df- und Extremwerte der Statistik ist die Größe der Ableitungkann überschreiten , was in solchen Fällen nahe , dass nur eine Dezimalstelle weniger als selbst angegeben werden sollte.h = 1 / 2 h | dν h=1/2 t| ∂h|ddxf(x)| t 0,01νp|∂∂νFν(t)| 0.01 ν p
Überzeugen Sie sich mit diesem beschrifteten Konturdiagramm der Größe der Ableitung für den niedrigsten (vernünftigen) df und die Bereiche vondas wäre von interesse (weil sie zu niedrigen p-werten führen können).|t|
Die Bezeichnungen zeigen den Logarithmus zur Basis 10 der Ableitung. Wenn Sie also an Punkten zwischen und in diesem Diagramm das gemeldete df an der Stelle nach dem Dezimalpunkt ändern, wird der gemeldete p-Wert wahrscheinlich nur in geändert und spätere Stellen. Angenommen, Sie runden den p-Wert auf (sechs Dezimalstellen). Betrachten Sie die Statistiken und . Diese befinden sich in der Nähe der log Kontur. Daher sollte mit Dezimalstellen angegeben werden.−k −(k+1) jth (j+k)th 10−6 ν=2.5 t=8 −3 ν 6+(−3)=3
Die hellblauen Bereiche für das größte sind von Belang, da sie zeigen, wo kleine Änderungen in die größten Auswirkungen auf den p-Wert haben.k ν
Vergleichen Sie dies mit der Situation für höhere df (von bis gezeigt):4 30
Der Einfluss von auf die Präzision von zunehmender schnell ab .ν p ν
quelle
Der Grund, warum dies eine Konvention war, ist, dass Tabellen nicht die Ganzzahl df haben. Es gibt keinen Grund, es anders zu machen.
Nun, die Statistik hat eigentlich keine t-Verteilung, weil der Quadrat-Nenner eigentlich keine skalierte Chi-Quadrat-Verteilung hat. Dies ist eine Annäherung, die in einem bestimmten Fall möglicherweise konservativ ist oder nicht. Wenn wir die genaue Verteilung der Statistik in einem bestimmten Fall berücksichtigen, ist die Abrundung möglicherweise nicht konservativ.
p-Werte aus t-Verteilungen (Anwenden der cdf auf eine t-Statistik) können mit einer Vielzahl ziemlich genauer Näherungen berechnet werden, sodass sie effektiv berechnet und nicht interpoliert werden.
Genau.
Eine Möglichkeit könnte darin bestehen, zu untersuchen, wie genau die Welch-Satterthwaite-Näherung für den p-Wert in diesem allgemeinen Bereich der Varianzverhältnisse ist, und nicht wesentlich mehr relative Genauigkeit zu zitieren, als dies im df nahelegt (wobei zu berücksichtigen ist, dass der df auf dem df liegt) (Chi-Quadrat im Quadrat des Nenners geben nur eine Annäherung an etwas, das ohnehin nicht Chi-Quadrat ist).
quelle