Ein Wahrscheinlichkeitsmodell besteht aus dem Triplett , wobei der Probenraum ist, eine Algebra (Ereignisse) und ist ein Wahrscheinlichkeitsmaß für .Ω F σ P F( Ω , F, P )ΩFσPF
Intuitive Erklärung . Ein Wahrscheinlichkeitsmodell kann als bekannte Zufallsvariable interpretiert werden . Zum Beispiel sei eine normalverteilte Zufallsvariable mit Mittelwert und Varianz . In diesem Fall ist das Wahrscheinlichkeitsmaß der kumulativen Verteilungsfunktion ( Cumulative Distribution Function, CDF) bis zugeordnetX 0 1 P FXX01PF
F( x ) = P ( X≤ x ) = P ( ω ∈ Ω : X( ω ) ≤ x ) = ∫x- ∞12 π--√exp( - t22) dt .
Verallgemeinerungen . Die Definition des Wahrscheinlichkeitsmodells hängt von der mathematischen Definition der Wahrscheinlichkeit ab, siehe z. B. Freie Wahrscheinlichkeit und Quantenwahrscheinlichkeit .
Ein statistisches Modell ist eine Menge von Wahrscheinlichkeitsmodellen. Dies ist eine Menge von Wahrscheinlichkeitsmaßen / -verteilungen im Stichprobenraum . ΩSΩ
Diese Menge von Wahrscheinlichkeitsverteilungen wird normalerweise ausgewählt, um ein bestimmtes Phänomen zu modellieren, von dem wir Daten haben.
Intuitive Erklärung . In einem statistischen Modell sind die Parameter und die Verteilung, die ein bestimmtes Phänomen beschreiben, beide unbekannt. Ein Beispiel hierfür ist die Familie der Normalverteilungen mit dem Mittelwert und der Varianz . Dies ist, dass beide Parameter unbekannt sind und Sie normalerweise die verwenden möchten Datensatz zur Schätzung der Parameter (dh Auswahl eines Elements von ). Diese Menge von Verteilungen kann für jedes und , aber, wenn ich mich nicht irre, sind in einem realen Beispiel nur diejenigen sinnvoll, die für dasselbe Paar definiert wurden Erwägen. σ 2 ∈ R + S Ω F ( Ω , F )μ ∈ Rσ2∈ R+SΩF( Ω , F)
Verallgemeinerungen . Dieses Papier enthält eine sehr formale Definition des statistischen Modells, aber der Autor erwähnt, dass "das Bayes'sche Modell eine zusätzliche Komponente in Form einer vorherigen Verteilung erfordert ... obwohl Bayes'sche Formulierungen nicht der Hauptfokus dieses Papiers sind". Daher hängt die Definition des statistischen Modells von der Art des verwendeten Modells ab: parametrisch oder nichtparametrisch. Auch in der Parametereinstellung hängt die Definition davon ab, wie Parameter behandelt werden (z. B. Klassisch vs. Bayesianisch).
Der Unterschied ist: In einem Wahrscheinlichkeitsmodell kennen Sie genau das Wahrscheinlichkeitsmaß, zum Beispiel eine , wobei bekannte Parameter sind Modell, das Sie als Verteilungssätze betrachten, z. B. , wobei unbekannte Parameter sind.μ 0 , σ 2 0 Normal ( μ , σ 2 ) μ , σ 2Normal ( μ0, σ20)μ0, σ20Normal (μ, σ2)μ , σ2
Keiner von ihnen erfordert einen Datensatz, aber ich würde sagen, dass für die Modellierung normalerweise ein statistisches Modell ausgewählt wird.