Wie kann ich 2 Mittel vergleichen, die von Laplace verteilt werden?

10

Ich möchte 2 Stichprobenmittelwerte für 1-Minuten-Aktienrenditen vergleichen. Ich gehe davon aus, dass sie Laplace-verteilt sind (bereits geprüft) und teile die Retouren in zwei Gruppen auf. Wie kann ich überprüfen, ob sie sich erheblich unterscheiden?

Ich denke, ich kann sie nicht wie eine Normalverteilung behandeln, denn obwohl sie mehr als 300 Werte haben, zeigt das QQ-Diagramm, dass es einen großen Unterschied zu einer Normalverteilung gibt

rauben
quelle
Nach Code / Paketen zu fragen ist hier kein Thema, aber Sie haben hier eine echte statistische Frage begraben. Möglicherweise möchten Sie Ihre Frage bearbeiten, um das zugrunde liegende statistische Problem zu klären. Wenn Sie die statistischen Konzepte verstehen, sind die softwarespezifischen Elemente möglicherweise selbstverständlich oder zumindest leicht aus der Dokumentation zu entnehmen.
Gung - Reinstate Monica
Wenn Sie "anders" sagen, interessieren Sie sich nur für die unterschiedlichen Mittel, und wenn ja, gehen Sie dann davon aus, dass die Spreads identisch sind?
Glen_b -State Monica
Ja, ich möchte nur wissen, ob sich die Mittelwerte erheblich unterscheiden, und ich gehe davon aus, dass die Verteilung identisch ist. Ich gehe nicht unbedingt davon aus, dass die Standardabweichung identisch ist, aber ich denke, das wäre auch
Rob
2
Bitte geben Sie weitere Details zu den 1-Minuten-Aktienretouren an. Möchten Sie Mittelwerte zeitlich korrelierter Daten vergleichen?
Michael M
2
Beachten Sie auch, dass die Anzahl der überprüften Werte die Verteilung nicht ändert. Sie können denken an die Verteilung der Probe werden Mittel , die bei für eine Laplace sein wird sehr nah an normal. n=300
Glen_b -State Monica

Antworten:

12

Angenommen, beide Laplace-Verteilungen haben die gleiche Varianz.

a) Der Likelihood-Ratio-Test würde eine Teststatistik beinhalten wie:

L=i=1n12τ^exp(|xiμ^|τ^)i=1n112τ^1exp(|xiμ^1|τ^1)i=n1+1n12τ^2exp(|xiμ^2|τ^2)

Protokolle erstellen, abbrechen / vereinfachen und mit multiplizieren .2

2l=2(nlog(τ^)n1log(τ^1)n2log(τ^2)) (wobei )l=log(L)

Dabei ist die mittlere absolute Abweichung vom Median in der kombinierten Stichprobe und die mittlere absolute Abweichung vom Median in Stichprobe .τ^=mτ^i=mii

Nach dem Satz von Wilks ist dies asymptotisch als unter der Null verteilt, sodass Sie für einen 5% -Test ablehnen würden, wenn dieser überschreitet .χ123.84

Simulationsexperimente legen nahe, dass der Test bei kleinen Stichprobengrößen antikonservativ ist (die Wahrscheinlichkeit der Ablehnung ist etwas höher als nominal), aber um etwa n = 100 scheint er zumindest vernünftig zu sein (Sie liegen in der Größenordnung von 5,3% - 5,4%) Ablehnungsrate unter Null für einen nominalen 5% -Test, zum Beispiel; für scheint sie näher an 5,25% zu liegen).n1,n2>300

b) Wir würden auch erwarten, dass eine gute Teststatistik ist (wobei die darstellt Stichprobenmedian und ); Wenn ich dort keinen Fehler gemacht habe, würde er in großen Stichproben wie Ihrer ungefähr normal unter der Null mit dem Mittelwert 0 und der Varianz 1 verteilt sein, wobei auf dem Quadrat der basieren könnte mittlere absolute Abweichung vom Mittelwert in der kombinierten Stichprobe, , obwohl ich davon , dass es in der Praxis besser funktionieren würde, wenn man es auf einen stichprobengewichteten Durchschnitt der beiden Stichproben 's .μ~1μ~2vμ~v=2τ^2(1n1+1n2)τ^2m2mi2

(Bearbeiten: Simulation legt nahe, dass die normale Näherung in Ordnung ist, aber die Varianzberechnung oben nicht korrekt ist; ich kann sehen, wo das Problem jetzt liegt, muss es aber noch beheben. Die Permutationsversion dieses Tests (siehe Punkt (c)) sollte noch in Ordnung sein).

c) Eine andere Alternative wäre die Durchführung eines Permutationstests auf der Grundlage einer der oben genannten Statistiken. (Eine der Antworten hier gibt einen Überblick darüber, wie der Permutationstest für einen Unterschied in den Medianwerten implementiert wird.)

d) Sie könnten immer einen Wilcoxon / Mann-Whitney-Test durchführen; Es ist wesentlich effizienter als der Versuch, einen T-Test am Laplace durchzuführen.

e) Besser als (d) für Laplace-Daten wäre der Mood-Median-Test; Während dies in Büchern oft empfohlen wird, zeigt es beim Umgang mit Laplace-Daten eine gute Leistung. Ich gehe davon aus, dass es eine ähnliche Leistung haben würde wie die Permutationsversion des asymptotischen Tests der Differenz im Median (einer der in (c) genannten Tests).

Die Frage hier gibt eine R-Implementierung an, die einen Fisher-Test verwendet, aber dieser Code kann angepasst werden, um stattdessen einen Chi-Quadrat-Test zu verwenden (was ich selbst in moderaten Beispielen vorschlagen würde). alternativ gibt es Beispielcode für sie (nicht als Funktion) hier .

Der Median-Test wird hier in Wikipedia diskutiert , wenn auch nicht sehr ausführlich (die verknüpfte deutsche Übersetzung enthält etwas mehr Informationen). Einige Bücher über Nichtparametrik diskutieren dies.

Glen_b - Monica neu starten
quelle
Vielen Dank! Kann ich dann die von Ihnen verwendete Teststatistik verwenden und ablehnen, wenn das Laplace-Quantil für Mittelwert = 0 und Standardabweichung = 1 überschritten wird, wie ich es beim Normalverteilungstest tun würde?
Rob
Es tut mir leid, ich weiß wirklich nicht, was Sie dort fragen, also müssen Sie im Detail erklären, was Sie meinen. Auf welche Teststatistik beziehen Sie sich? [Sie sollten sich an die in (a), (c) oder (d) genannten Tests halten, da mit meiner berechneten Varianz in der zweiten, asymptotischen mit (b) gekennzeichneten Varianz etwas nicht stimmt, da meine Bearbeitung mit einem " " markiert ist. Staaten klar. Ich muss diesen Fall noch beheben, aber ich komme möglicherweise nicht schnell dazu.
Glen_b - Monica am
@Glen_b. Nützliche Antwort danke (+1), aber das Nullmodell hat 2 Parameter ( und ), während die Alternative 4 hat. Also sollte es ? (obwohl ich für den Fall der kleinen bis mittelgroßen Stichprobengröße ohnehin Werte durch Simulation μ^τ^χ22
tabelliere
Oder haben Sie eine einzelne Schätzung für die Skala im alternativen Modell verwendet?
P. Windridge
@ P.Windridge Dies ist ein ausgezeichneter Punkt. Ja, da ich den algebraischen Ausdruck habe, der eine Reduzierung von 2 freien Parametern von der Alternative zur Null darstellt (aber tatsächlich habe ich beim Schreiben von darüber nachgedacht, dieselbe Skala ). Ich muss das beheben, damit alles konsistent ist (und während ich dabei bin, sollte ich es χ12
überarbeiten