Frequentistische Definition der Wahrscheinlichkeit; Gibt es eine formale Definition?

10

Gibt es eine formale (mathematische) Definition dessen, was Frequentisten unter "Wahrscheinlichkeit" verstehen? Ich habe gelesen, dass es die relative Häufigkeit des Auftretens auf lange Sicht ist, aber gibt es eine formale Möglichkeit, es zu definieren? Gibt es bekannte Referenzen, wo ich diese Definition finden kann?

BEARBEITEN:

Mit Frequentist (siehe Kommentar von @whuber und meine Kommentare zur Antwort @Kodiologist und @Graeme Walsh unter dieser Antwort) meine ich diejenigen, die "glauben", dass diese langfristige relative Häufigkeit existiert. Vielleicht beantwortet dies (teilweise) auch die Frage von @Tim


quelle
7
Bitte erklären Sie, was Sie unter "Frequentist" verstehen. Die Verwendungen, die ich in anderen Threads gesehen habe, weisen darauf hin, dass viele Menschen keine einheitliche oder klare Vorstellung davon haben, was dieser Begriff bedeuten könnte. Eine Definition würde daher helfen, alle Antworten relevant zu halten.
whuber
5
@ Whuber Ich denke, die Definition von Frequentist ist "nicht Bayesianisch" und von Bayesianisch ist in den meisten Fällen "Nicht-Frequentist" :)
Tim
1
Eng verwandt: en.wikipedia.org/wiki/Empirical_probability
Silverfish
2
Ich wollte sagen, dass diese stats.stackexchange.com/a/230943/113090 wahrscheinlich für Sie von Interesse sein würde, aber dann wurde mir klar, dass Sie die Person sind, die diese Antwort gepostet hat, also egal . Wie auch immer, Ihr Denkprozess dort könnte für andere von Interesse sein, die auch die gleiche Frage haben wie Sie (z. B. ich) "
Gibt
6
Ich bin nicht sicher, ob ich die Energie haben werde, selbst eine Antwort zu schreiben, aber ich möchte hier den gleichen Link zum Eintrag der Stanford Encyclopedia of Philosophy über Interpretationen der Wahrscheinlichkeit hinterlassen, den ich unter Ihrer Antwort im zugehörigen Thread gepostet habe. Der Abschnitt über die häufigere Interpretation / Definition ist eine gute Lektüre. Es wird ausführlich über verschiedene konzeptionelle Probleme mit Versuchen gesprochen, eine häufigere Definition der Wahrscheinlichkeit zu geben.
Amöbe

Antworten:

4

TL; DR Es scheint nicht möglich zu sein, eine häufig auftretende Wahrscheinlichkeitsdefinition zu definieren, die mit dem Kolmogorov-Framework übereinstimmt und nicht vollständig zirkulär ist (dh im Sinne einer zirkulären Logik).

nA.

limnnAn
nA

Alle diese Konvergenzbegriffe erfordern jedoch ein Maß für den Wahrscheinlichkeitsraum, der definiert werden muss, um sinnvoll zu sein. Die intuitive Wahl wäre natürlich, Konvergenz fast sicher zu wählen. Dies hat die Eigenschaft, dass der Grenzwert punktweise existieren muss, außer bei einem Ereignis von Maß Null. Was eine Menge von Kennzahlen Null ausmacht, fällt für jede Familie von Kennzahlen zusammen, die absolut kontinuierlich zueinander sind. Dies ermöglicht es uns, einen Begriff der fast sicheren Konvergenz zu definieren, der die oben genannte Grenze streng macht und dennoch etwas agnostisch in Bezug auf die zugrunde liegenden Werte ist Maß für den messbaren Raum von Ereignissen ist (dh weil es jedes Maß sein kann, das in Bezug auf ein ausgewähltes Maß absolut kontinuierlich ist). Dies würde eine Zirkularität in der Definition verhindern, die sich aus der Festlegung einer bestimmten Maßnahme im Voraus ergeben würde.

Wenn wir jedoch eine fast sichere Konvergenz verwenden, bedeutet dies, dass wir uns auf die Situation des starken Gesetzes der großen Zahlen (fortan SLLN) beschränken. Lassen Sie mich diesen Satz (wie auf S. 133 von Chung angegeben) hier als Referenz angeben:

Sei eine Folge unabhängiger, identisch verteilter Zufallsvariablen. Dann haben wir wobei .E | X 1 | < {Xn}E | X 1 | =

E|X1|<SnnE(X1)a.s.
S n : = X 1 + X 2 + + X n
E|X1|=limsupn|Sn|n=+a.s.
Sn:=X1+X2++Xn

wir also an, wir haben einen messbaren Raum und möchten die Wahrscheinlichkeit eines Ereignisses in Bezug auf eine Familie von gegenseitig absolut kontinuierlichen Wahrscheinlichkeitsmaßen . Dann können wir entweder durch den Kolmogorov-Erweiterungssatz oder den Ionescu Tulcea-Erweiterungssatz (ich denke, beide funktionieren) eine Familie von Produkträumen konstruieren , eine für jedes . (Beachten Sie, dass die Existenz unendlicher Produkträume, die eine Schlussfolgerung aus Kolmogorovs Theorem ist, erfordert, dass das Maß jedes Raums , weshalb ich mich jetzt auf wahrscheinliche statt willkürliche Maße beschränke). Dann definierenA F { μ i } i I { ( j = 1 X j ) i } i I μ i 1 1 A j 1 A j 0 n A = 1 A 1 + 1 A 2 + + 1 A n . 0 E i(X,F)AF{μi}iI{(j=1Xj)i}iIμi11Aj ist die Indikator-Zufallsvariable, dh sie entspricht wenn in der ten Kopie vorkommt, und wenn dies nicht der Fall ist, mit anderen WortenDann ist eindeutig (wobei die Erwartung in Bezug auf ), so dass das starke Gesetz der großen Zahlen tatsächlich gilt gelten für (weil konstruktionsbedingt die1Aj0

nA=1A1+1A2++1An.
E i μ i (j = 1 X j ) i 1 A j n A.0Ei1Aj1Eiμi(j=1Xj)i1Ajsind identisch und unabhängig verteilt - beachten Sie, dass unabhängig verteilt zu sein bedeutet, dass das Maß des Produktraums in Bezug auf die Koordinatenmaße multiplikativ ist, sodass wir und damit unsere Definition für die Wahrscheinlichkeit von in Bezug auf sollte natürlich .A μ i E 1 1 A.
nAnEi1A1a.s.
AμiE11A

Ich habe jedoch gerade festgestellt, dass, obwohl die Folge von Zufallsvariablen in Bezug auf genau dann fast sicher konvergiert, wenn sie in Bezug auf fast sicher konvergiert , ( wobei ) das nicht unbedingt bedeutet, dass es auf den gleichen Wert konvergiert ; Tatsächlich garantiert die SLLN, dass dies nicht der Fall ist, es sei denn, ist generisch nicht wahr. μi1μi2i1,i2IEi11A=Ei21A.nAnμi1μi2i1,i2IEi11A=Ei21A

Wenn irgendwie "kanonisch genug" ist, etwa wie die gleichmäßige Verteilung für eine endliche Menge, dann funktioniert das vielleicht gut, gibt aber keine neuen Erkenntnisse. Insbesondere für die Gleichverteilung ist , dh die Wahrscheinlichkeit von ist nur der Anteil der Punkte oder Elementarereignisse in die gehören zu , was mir wieder etwas kreisförmig erscheint. Für eine kontinuierliche Zufallsvariable sehe ich nicht, wie wir uns jemals auf eine "kanonische" Wahl von einigen könnten .μE1A=|A||X|AXAμ

Das heißt, es scheint sinnvoll zu sein, die Häufigkeit eines Ereignisses als die Wahrscheinlichkeit des Ereignisses zu definieren, aber es scheint nicht sinnvoll zu sein, die Wahrscheinlichkeit des Ereignisses als die Häufigkeit zu definieren (zumindest ohne kreisförmig zu sein). Dies ist besonders problematisch, da wir im wirklichen Leben nicht wirklich wissen, wie hoch die Wahrscheinlichkeit ist; wir müssen es schätzen.

Beachten Sie auch, dass diese Definition der Frequenz für eine Teilmenge eines messbaren Raums davon abhängt, dass das gewählte Maß ein Wahrscheinlichkeitsraum ist. Zum Beispiel gibt es kein Produktmaß für zählbar viele Kopien von die mit dem Lebesgue-Maß ausgestattet sind, da . Ebenso ist das Maß von Verwendung des kanonischen Produktmaßes , das entweder bis unendlich hochbläst, wenn oder auf Null geht, wenn , dh die Erweiterungssätze von Kolmogorov und Tulcea sind sehr spezielle Ergebnisse, die Wahrscheinlichkeitsmaßen eigen sind. μ ( R ) = n j = 1 X ( μ ( X ) ) n μ ( X ) >Rμ(R)=j=1nX(μ(X))nμ(X)>1μ(X)<1

Chill2Macht
quelle
1
Danke für die nette Antwort (+1). Ich stimme zu, dass es Probleme mit der Definition in Bezug auf eine langfristige relative Häufigkeit gibt, was wahrscheinlich einer der Gründe war, warum Kolmogorov seine Grundbegriffe entwickelt hat. Wenn wir jedoch über Frequentisten sprechen, müssen wir uns in den Zeitrahmen vor Kolmogorovs Theorie stellen, denke ich?
2
@fcop Ich denke ehrlich, ich habe keine Ahnung. Ich denke, ich versuche zu sagen, dass ich nicht sehe, wie eine strenge Rechtfertigung für das häufig auftretende Verständnis der Wahrscheinlichkeit zu einer nützlichen / nicht zirkulären Definition führen könnte.
Chill2Macht
@fcop Ich schätze das großzügige Kopfgeld sehr - ich war heute wirklich ziemlich schlecht gelaunt, bevor ich es erhielt. Es hat mich ehrlich gesagt etwas niedergeschlagen (auf eine gute Art und Weise). Wieder schätze ich es wirklich
Chill2Macht
Erwähne es nicht, deine Antwort ist sehr gut entwickelt und mathematisch fundiert.
6

Ich glaube nicht, dass es eine mathematische Definition gibt, nein. Der Unterschied zwischen den verschiedenen Interpretationen der Wahrscheinlichkeit ist kein Unterschied in der mathematischen Definition der Wahrscheinlichkeit. Die Wahrscheinlichkeit könnte folgendermaßen mathematisch definiert werden: Wenn ein Messraum mit , dann ist die Wahrscheinlichkeit eines Ereignisses nur . Ich hoffe, Sie stimmen zu, dass diese Definition neutral gegenüber Fragen ist, ob wir Wahrscheinlichkeiten häufig oder bayesianisch interpretieren sollten.(Ω,Σ,μ)μ(Ω)=1SΣμ(S)

Kodiologe
quelle
Das ist in Ordnung, aber diese Definition der Wahrscheinlichkeit als , die die Axiome von Kolmogorov erfüllt, ist sehr abstrakt und muss in bestimmten Fällen definiert werden. Es ist dasselbe wie "ein Kreis ist die Menge von Punkten, die sich in einem bestimmten Abstand von einem festen Punkt befinden". Es bedeutet nichts, solange Sie nicht sagen, in welchem ​​metrischen Raum Sie sich befinden: Sie sollten sagen, was die Definition von "Entfernung" ist. Ich denke, dass die Definition von als langfristige Relatve-Frequenz die Axiome von Kolmogorov erfüllt. Was denken Sie? PS Die Definition im Kommentar von @Silverfish erfüllt auch diese Axiome. P.μP
(Fortsetzung) Kurz gesagt, ich kann definieren ( definieren ist das richtige Wort), viele , die die Axiome von Kolmogorov erfüllen, und dies sind alles gültige Wahrscheinlichkeiten gemäß der axiomatischen Theorie. μ
Das System von Kolmogorov bietet wohl eine axiomatische Grundlage - was nicht unbedingt eine frequentistische oder bayesianische Interpretation beinhaltet. Im Sinne der frequentistischen Sichtweise besteht die Grundidee darin, dass sich die empirische Frequenz mit zunehmender Anzahl von Versuchen um die Unendlichkeit um einen bestimmten Wert stabilisiert oder zu diesem konvergiert; die Wahrscheinlichkeit des Ereignisses. Obwohl der Frequenzansatz den klassischen Ansatz verbessert, führt der Mangel an Strenge zur axiomatischen Grundlage. Ist das eher eine Frage zur Geschichte der Wahrscheinlichkeitstheorie?
limn(nA/n)=PA=P(A).
Graeme Walsh
@ Graeme Walsh: Könnten Sie das in eine Antwort einfügen und mit Argumenten vervollständigen, warum eine solche Definition von mit Kolmogorovs Axiomen übereinstimmt? (Natürlich kann man die Existenz der Grenze in Frage stellen, aber dann könnten wir sagen, dass Frequentisten diejenigen sind, die an die Existenz glauben?)P(A)
2
@fcop Wie Walsh bemerkt, ist diese "Definition" nicht streng.
Kodiologe