Wenn Sie eine Münze werfen und 268 Köpfe und 98 Schwänze erhalten, können Sie die Wahrscheinlichkeit berechnen, dass die Münze auf verschiedene Weise fair ist. Eine einfache heuristische Beobachtung hätte höchstwahrscheinlich den Schluss gezogen, dass eine solche Münze unfair ist. Ich habe den p-Wert in R berechnet mit:
> coin <- pbinom(98, 366, 0.5)
> coin*2
[1] 2.214369e-19
Dieser Wert ist kleiner als 0,05, daher lehnen wir die Hypothese ab, dass es sich um eine faire Münze handelt.
Aber was ist, wenn Sie erfahren haben, dass dieselbe Münze während des Prozesses 676 Mal auf der Seite gelandet ist? Heuristisch werden Sie wahrscheinlich zu dem gleichen Schluss kommen, aber wären die typischen fairen Münztests immer noch gültig?
Hier ist eine Grafik, um das Problem zu veranschaulichen:
Was sind gültige Methoden, um die Hypothese zu testen, dass die gleiche Wahrscheinlichkeit besteht, dass ein Ereignis in den schattierten Bereichen auftritt?
HINWEIS: Die grafische Darstellung enthält 629 positive Bewegungen (413 negative).
R-Code, der die Daten generiert:
require("quantmod")
ticker <- getSymbols("SLV")[,6]
change <- (ticker - lag(ticker, 24)) / lag(ticker, 24)
change <- na.locf(change, na.rm=TRUE)
# some other calculations
dens <- density(change)
plot(dens)
# some formatting stuff
quelle
Antworten:
Ich bin mir ziemlich sicher, dass die Antwort ja lautet . Der Standard-Binomial-Test für faire Münzen ist immer noch gültig: Wenn Sie testen möchten, ob zwei der drei Wahrscheinlichkeiten einer Multinomialverteilung gleich sind, aber keine Hypothesen darüber interessiert sind Mit der dritten Wahrscheinlichkeit können Sie die Zahlen der beiden entsprechenden Ergebnisse so analysieren, als ob sie aus einer Binomialverteilung stammen .
Tatsächlich scheint dies eine gute Übung für ausreichende Statistiken und bedingte Wahrscheinlichkeiten zu sein:
Sie können sich dies als eine multinomiale Verteilung mit drei möglichen Ergebnissen und damit zwei schätzbaren Parametern vorstellen (da die drei Wahrscheinlichkeiten 1 ergeben müssen). Sie sind jedoch nicht an der Wahrscheinlichkeit des "mittleren" Ergebnisses interessiert, daher können Sie dies als störenden Parameter und die Differenz zwischen der Anzahl der "oberen" und "unteren" Ergebnisse als den interessierenden Parameter betrachten.
Es ist einfach zu zeigen (unter Verwendung des Fisher-Neyman-Faktorisierungssatzes ), dass die Anzahl der 'oberen' und 'unteren' Ergebnisse zusammen eine (zweidimensionale) ausreichende Statistik für den interessierenden Parameter bildet, dh die Anzahl der 'mittleren' Ergebnisse nicht Geben Sie keine zusätzlichen Informationen zum Wert des interessierenden Parameters an. Die Anzahl der "mittleren" Ergebnisse ist eindeutig eine ausreichende Statistik für den Störparameter. Wenn wir von letzterem abhängig machen, denke ich (habe es nicht richtig überprüft), dass die resultierende bedingte Wahrscheinlichkeit die gleiche ist wie die Wahrscheinlichkeit für die Binomialverteilung, dh das Problem des Münzwurfs.
quelle
Wenn Sie dies als Binomialproblem (p, 1-p) und nicht als Multinomialproblem einrahmen, können Sie nur die Vergangenheit beschreiben. Sie werden nichts über die Zukunft sagen können. Warum? Das Entfernen der mittleren "Edge Flips" ist mit Ihrer Umgruppierung der Daten verbunden.
Mit anderen Worten, Ihre "Daten beschrieben" Wahrscheinlichkeit "p" eines positiven Ergebnisses und Wahrscheinlichkeit "1-p" eines negativen Ergebnisses gelten nicht für den nächsten "Binomialwurf der Münze", da Sie in Zukunft wirklich Wahrscheinlichkeiten haben "x", "y" und "(1-xy)".
Bearbeiten (27.03.2011) ===============================
Ich habe das folgende Diagramm hinzugefügt, um meine Kommentare unten zu erläutern.
quelle