Was ist die Verteilung der Differenz von zwei-t-Verteilungen

19

... und warum ?

Angenommen, , sind unabhängige Zufallsvariablen mit dem Mittelwert und der Varianz . Mein grundlegendes Statistikbuch besagt, dass die Verteilung von die folgenden Eigenschaften aufweist:X 2 μ 1 , μ 2 σ 2 1 , σ 2 2 X 1 - X 2X1X2μ1,μ2σ12,σ22X1-X2

  • E(X1-X2)=μ1-μ2
  • Veinr(X1-X2)=σ12+σ22

Lassen Sie uns jetzt sagen , sind t-Verteilungen mit , Freiheitsgraden. Wie ist die Verteilung von ?X1X2n1-1n2-2X1-X2

Diese Frage wurde bearbeitet: Die ursprüngliche Frage lautete "Was sind die Freiheitsgrade der Differenz zweier t-Verteilungen?" . mpiktas hat bereits darauf hingewiesen, dass dies keinen Sinn macht, da nicht t-verteilt ist, egal wie ungefähr normal (dh hoch df) sein mag.X1-X2X1,X2

steffen
quelle
1
Dies ist eine verwandte Frage, die von Interesse sein könnte.
mpiktas
2
Google den Satterthwaite-T-Test, den CABF-T-Test (Cochrans Annäherung an das Behrens-Fisher-Problem) und das Behrens-Fisher-Problem.
whuber
3
Für den speziellen Fall, dass der Freiheitsgrad 1 ist (die Cauchy-Verteilung), lautet die Antwort auf die ursprüngliche Frage 1. Die Summe (oder Differenz) zweier unabhängiger Cauchy-verteilter Zufallsvariablen ist Cauchy mit dem Skalenparameter , aber andererseits Die Cauchy-Verteilung hat nicht einmal einen Mittelwert. 2
NRH
1
Sie müssen die Behrens-Fisher-Verteilung überprüfen
Wis

Antworten:

15

Die Summe zweier unabhängiger t-verteilter Zufallsvariablen ist nicht t-verteilt. Daher können Sie nicht über Freiheitsgrade dieser Verteilung sprechen, da die resultierende Verteilung keine Freiheitsgrade in einem Sinne aufweist, den die t-Verteilung hat.

mpiktas
quelle
@mpiktas: Blöde Frage. Wenn sich die t-Verteilung mit n-1 df aus der Summe von n unabhängigen Normalverteilungen ableiten lässt (siehe Wikipedia) und df so hoch ist, dass die t-Verteilung der Normalverteilung nahekommt, leitet sich daraus nicht ab, dass die Summe von t-Verteilungen ist wieder eine t-Verteilung?
steffen
@mpiktas: Was ist mit der Teststatistik des t-Tests, die sich aus der Differenz zweier t-Verteilungen abzuleiten scheint?
steffen
1
@steffen, nein. Dies ist ungefähr normal, da Sie zwei ungefähr normal verteilte Normalvariablen hinzufügen. Die t-Verteilung mit hohem df ist ungefähr normal, aber ungefähr normal ist nicht notwendigerweise die t-Verteilung mit hohem df.
mpiktas
1
@steffen, t-Test-Statistik wird aus der Differenz zweier Normalen und nicht zweier t-Verteilungen abgeleitet. Es ist zu beachten, dass die Definition der t-Verteilung ein Bruchteil der Normalen und der Quadratwurzel des Chi-Quadrats ist.
mpiktas
1
@steffen, ich sage meinen Schülern oft, es gibt keine dummen Fragen, nur dumme Leute, die keine Fragen stellen. Ich bin kein sehr beliebter Lehrer, den ich hinzufügen sollte :)
mpiktas
4

Stimmen die obigen Antworten überein, ist die Differenz zweier unabhängiger t-verteilter Zufallsvariablen nicht t-verteilt. Aber ich möchte einige Berechnungsmöglichkeiten hinzufügen.

  1. Dies lässt sich am einfachsten mit einer Monte-Carlo-Methode berechnen. In R werden beispielsweise 100.000 Zahlen aus der ersten t-Verteilung zufällig ausgewählt, und anschließend werden weitere 100.000 Zahlen aus der zweiten t-Verteilung zufällig ausgewählt. Sie lassen den ersten Satz von 100.000 Zahlen minus dem zweiten Satz von 100.000 Zahlen. Die erhaltenen 100.000 neuen Zahlen sind die Zufallsstichproben aus der Verteilung der Differenz zwischen den beiden Verteilungen. Sie können den Mittelwert und die Varianz einfach mit mean()und berechnen var().

    1. Dies nennt man Behrens-Fisher-Verteilung. Sie können auf die Wiki-Seite verweisen: https://en.wikipedia.org/wiki/Behrens%E2%80%93Fisher_distribution . Der durch diese Verteilung gegebene CI wird als "Referenzintervall" bezeichnet, dies ist kein CI .

    2. Die numerische Integration könnte funktionieren. Dies wird als Aufzählungspunkt 2 fortgesetzt. Sie können sich auf den Abschnitt 2.5.2 in Bayesian Inference in Statistical Analysis von Box, George EP, Tiao und George C beziehen. Er enthält die detaillierten Schritte der Integration und wie diese angenähert werden eine Behrens-Fisher-Verteilung.

Shijia Bian
quelle
1
Es scheint mir, dass die Behrens-Fisher-Verteilung gilt, wenn die Varianz der beiden t-Verteilungen nicht gleich ist. Kann das Gleiche gesagt werden, wenn die Varianz der beiden Verteilungen gleich ist?
Ian Sudbery
1
Entschuldigung, drückte die Eingabetaste vorzeitig? Um fortzufahren ... Sagen wir zum Beispiel, wir haben zwei Normalverteilungen gleicher, aber unbekannter Varianz, aber unterschiedlicher Mittelwerte. Aus jeder dieser Verteilungen ziehen wir zwei Beispiele. Die Mittelwertdifferenz zwischen den beiden Stichproben derselben Verteilung folgt einer t-Verteilung, aber wie verteilt sich die Differenz der Unterschiede?
Ian Sudbery