Was ist das Bayes'sche Gegenstück zu einem T-Test mit zwei Stichproben und ungleichen Varianzen?

Ich suche das bayesianische Gegenstück zum Zwei-Stichproben-T-Test mit ungleichen Varianzen (Welch-Test). Ich suche auch nach einem multivariaten Test wie der T-Statistik von Hotelling. Referenzen geschätzt.

Nehmen wir für den multivariaten Fall an, dass wir und , wobei (bzw. ) eine Abkürzung für einen Stichprobenmittelwert, eine Stichprobenstandardabweichung und eine Anzahl von Punkten ist. Wir können davon ausgehen, dass die Anzahl der Punkte über den gesamten Datensatz konstant ist, die Standardabweichung für alle (bzw. ) gleich ist und dass die Stichprobenmittelwerte von (bzw. ) korreliert sind. Wenn Sie die Stichprobenmittel zeichnen, folgen sie einander und durch Verbinden erhalten Sie eine gleichmäßig variierende Funktion. Nun stimmt die Funktion an einigen Stellen mit der überein $(y_1,\cdots,y_N)$ $(z_1,\cdots,z_N)$ $y_i$ $z_i$ $y_i$ $z_i$ $y_i$ $z_i$ $y$ $z$ Funktion, bei anderen jedoch nicht, da groß wird. Ich möchte diese Aussage quantifizieren. $\frac{mean(y_i)-mean(z_i)}{std(y_i)+std(z_i)}$

correlation bayesian t-test heteroscedasticity Yannick
quelle

Ich habe meine Antwort aktualisiert.

John Salvatier

Wenn Sie "Behrens Fisher" in das Suchfeld eingeben, erhalten Sie wertvolle Informationen über den Bayes'schen Ansatz für die beiden unabhängigen Stichproben mit ungleichen Varianzen.

Stéphane Laurent

Antworten:

Während Sie dies auf Bayes'sche Weise tun können, haben Sie sich überlegt, ob es tatsächlich besser wäre, den Unterschied in den Mitteln abzuschätzen, als zu testen, ob sie unterschiedlich sind? Dies empfiehlt Andrew Gelman häufig . Ich kann mir einige mögliche Gründe vorstellen, warum ich Hypothesentests durchführen möchte, aber ich denke nicht, dass sie so häufig sind.

Ich glaube nicht, dass Sie so etwas wie einen T-Test brauchen, weil Sie die Standardabweichung gut abschätzen können, weil Sie sagten, dass die Gruppen sehr ähnliche Standardabweichungen haben.

Wenn das der Fall ist, sollte dieser Link genau das sein, was Sie brauchen. Es zeigt, wie man einen Mittelwertunterschied schätzt oder einen Hypothesentest durchführt (obwohl ich dies nicht empfehle). Sie können sich auch den Teil ansehen, auf den sie in Bolstads Buch verweisen (elektronische Kopien finden Sie online). Es ist möglich, auch die Schätzung der Varianzen einzubeziehen, aber es ist komplexer. Ich vermute, Sie sollten die vorherigen Informationen, die Sie über die Abweichungen haben, auf naive Weise einbeziehen (z. B. mithilfe des unverzerrten Stdev-Schätzers für jeden der Sätze und dann mittle sie und tue so, als wären das deine 'bekannten' stdevs).

John Salvatier
quelle

Ja, aber das führt zu einem anderen Problem. Wie können Sie wissen, ob der Unterschied in den Mitteln tatsächlich signifikant ist? Ich würde es mit der Summe der SD jeder Probe vergleichen, aber das ist nicht sehr streng.

Yannick

@yannick: "signifikant", statistisch oder real?

Wayne

@ Wayne reale Welt, nehme ich an.

Yannick

@yannick: Die reale Bedeutung ist ein Domänenwissensproblem, kein statistisches. Das heißt, ich kann Ihnen sagen, dass ich einige Gewichtsdaten habe und es einen statistisch signifikanten Unterschied von 10 Gramm bei den Durchschnittsgewichten zwischen zwei Gruppen auf 95% -Niveau gibt, aber hat das eine reale Bedeutung? Für eine Elritze, ja, für erwachsene Männer, nein. Wenn Sie über die Bedeutung der realen Welt sprechen, würde ich mir vorstellen, dass ein Vergleich mit SD oder die Bestimmung von Quantilen Ihre Frage beantworten würde, auch wenn dies nicht streng erscheint und Raum für jemanden lässt, der Ihnen nicht zustimmt.

Wayne

\frac{m_{1} - m_{2}}{s_{1} + s_{2}}

$\frac{m_1-m_2}{s_1+s_2}$

John Kruschke hat eine Bayes'sche Routine entwickelt, die als Ersatz für den T-Test mit zwei Stichproben gedacht ist. Die Routine heißt BEST (Bayesian Estimation ersetzt den T-Test) und wird hier beschrieben . Ich habe auch eine Online-Javascript-Version, die im Browser ausgeführt wird, hier verfügbar gemacht .

Rasmus Bååth
quelle