Warum definiert eine kumulative Verteilungsfunktion (Cumulative Distribution Function, CDF) eine Verteilung eindeutig?

Mir wurde immer gesagt, dass ein CDF einzigartig ist, ein PDF / PMF jedoch nicht einzigartig. Warum ist das so? Können Sie ein Beispiel nennen, bei dem ein PDF / PMF nicht eindeutig ist?

probability distributions pdf cdf DKangeyan
quelle

In Bezug auf die Eindeutigkeit möchten Sie vielleicht über den Unterschied zwischen der PDF einer gleichmäßigen Verteilung auf

[0, 1]

$[0,1]$ und einer gleichmäßigen Verteilung auf ihrem Inneren

nachdenken

(0, 1)

$(0,1)$ . Eine andere unterhaltsame Übung - die sich mit der Frage befasst, ob es überhaupt ein PDF gibt - besteht darin, darüber nachzudenken, wie das PDF einer Verteilung über die rationalen Zahlen aussehen würde. Zum Beispiel sei wenn , und

ungerade sind.

Pr (j 2^{- i}) = 2^{1 - 2 i}

$\Pr(j2^{-i})=2^{1-2i}$

0 < j 2^{- i} < 1

$0\lt j2^{-i}\lt 1$

i \geq 1

$i\ge 1$

j

$j$

Whuber

Nicht alle Distributionen haben sogar eine PDF-Datei oder eine PMF-Datei, während der Blick auf die CDF eine einheitliche Sicht auf die Dinge gibt. Kontinuierliche Variablen haben glatt aussehende CDFs, diskrete Variablen haben eine "Treppe" und einige CDFs sind gemischt.

Silverfish

@ Silverfish: ... und einige sind keine der oben genannten! :-)

Kardinal

Um den Titel zu adressieren (vielleicht etwas locker), definiert die CDF eine Distribution, weil die CDF (oder gleichbedeutend nur DF / "Distributionsfunktion"; das "C" dient nur der Verdeutlichung, um welches Objekt es sich handelt) der Begriff ist "Verteilung" bezieht sich wörtlich auf; Das "D" ist der Hinweis auf diesen Teil. Dass es eindeutig ist, folgt aus dem "F" - Funktionen sind einwertig, wenn also zwei Verteilungsfunktionen identisch sind, ist das Objekt, das sie definieren, dasselbe; Wenn sich die DFs irgendwo unterscheiden würden, wäre das, wofür sie definiert sind, an diesen Punkten anders. Ist das Tautologie? Ich glaube, es ist.

Glen_b

@ Glen_b Es geht tautologisch nur um die trainierte Intuition. Eine Verteilungsfunktion gibt nur Wahrscheinlichkeiten der Form während die gesamte Verteilung Wahrscheinlichkeiten der Form angibt. für beliebige messbare Mengen Sie müssen bestimmt zeigen Wie NicholasB ausführt, geht es darum, eine Vormessung aus einem Halbring (mit halboffenen Intervallen) zu erweitern: , zum vollen Lebesgue-Sigma-Feld und zeigt es einzigartig.

F

$F$

F (x) = Pr {ω \in Ω | X (ω) \leq x}

$F(x)=\Pr\{\omega\in\Omega\,|\,X(\omega)\le x\}$

Pr ({ω \in Ω | X (ω) \in B}

$\Pr(\{\omega\in\Omega\,|\,X(\omega)\in\mathcal{B}\}$

B \subset R

$\mathcal{B}\subset\mathbb R$

F

$F$

μ ((a, b]) = F (b) - F (a)

$\mu((a,b])=F(b)-F(a)$

whuber

Antworten:

Erinnern wir uns an einige Dinge. Sei ein Wahrscheinlichkeitsraum , ist unsere Stichprobenmenge, ist unsere Algebra und ist eine auf definierte Wahrscheinlichkeitsfunktion . Eine Zufallsvariable ist eine messbare Funktion dh für eine beliebige messbare Lebesgue-Untermenge in . Wenn Sie mit diesem Konzept nicht vertraut sind, ergibt alles, was ich später sage, keinen Sinn. $(\Omega,A,P)$ $\Omega$ $A$ $\sigma$ $P$ $A$ $X:\Omega \to \mathbb{R}$ $X^{-1}(S) \in A$ $\mathbb{R}$

Jedes Mal, wenn wir eine Zufallsvariable haben, , wird durch die kategoriale Pushforward- Methode ein Wahrscheinlichkeitsmaß für induziert . Mit anderen Worten, . Es ist trivial zu prüfen, ob ein Wahrscheinlichkeitsmaß für . Wir nennen die Verteilung von . $X:\Omega \to \mathbb{R}$ $X'$ $\mathbb{R}$ $X'(S) = P(X^{-1}(S))$ $X'$ $\mathbb{R}$ $X'$ $X$

Mit diesem Konzept ist nun etwas verbunden, das als Verteilungsfunktion einer Funktionsvariablen bezeichnet wird. Bei einer Zufallsvariablen definieren wir . Verteilungsfunktionen haben folgende Eigenschaften: $X:\Omega \to \mathbb{R}$ $F(x) = P(X\leq x)$ $F:\mathbb{R} \to [0,1]$

$F$ ist rechts stetig .
$F$ nimmt nicht ab
$F(\infty) = 1$ und . $F(-\infty)=0$

Klar zufällige Variablen, die gleich sind, haben die gleiche Verteilung und Verteilungsfunktion.

Es ist ziemlich technisch, den Prozess umzukehren und ein Maß mit der angegebenen Verteilungsfunktion zu erhalten. Angenommen, Sie erhalten eine Verteilungsfunktion . Definieren Sie . Sie müssen zeigen, dass ein Maß für die Halbalgebra der Intervalle von . Anschließend können Sie die Carathéodory anwenden Erweiterungstheorem , um auf ein Wahrscheinlichkeitsmaß für . $F(x)$ $\mu(a,b] = F(b) - F(a)$ $\mu$ $(a,b]$ $\mu$ $\mathbb{R}$

Nicolas Bourbaki
quelle

Dies ist ein guter Anfang für eine Antwort, kann aber die Angelegenheit ein wenig unbeabsichtigt verdecken. Das Hauptproblem scheint zu zeigen, dass zwei Kennzahlen mit der gleichen Verteilungsfunktion tatsächlich gleich sind. Dies erfordert nichts weiter als Dynkins

Theorem und die Tatsache, dass Mengen der Form

ein

System bilden, das die Borel-

Algebra erzeugt . Dann kann die Eindeutigkeit einer Dichte (vorausgesetzt, sie existiert!) angesprochen werden und im Gegensatz zu den oben genannten.

π

$\pi$

λ

$\lambda$

(- \infty, b]

$(-\infty, b]$

π

$\pi$

σ

$\sigma$

Kardinal

(Ein weiteres kleines Problem: Zufällige Variablen werden normalerweise in Form von Borel-Sätzen und nicht in Form von Lebesgue-Sätzen definiert.) Ich denke, dass diese Antwort mit einigen kleinen Änderungen ziemlich klar wird. :-)

Kardinal

@ Kardinal Ich denke zuerst an die Analyse, dann an die Wahrscheinlichkeit. Daher kann dies erklären, warum ich lieber an Lebesgue-Sets denke. In beiden Fällen hat dies keinen Einfluss auf das Gesagte.

Nicolas Bourbaki

Um die Anfrage nach einem Beispiel für zwei Dichten mit dem gleichen Integral (dh mit der gleichen Verteilungsfunktion) zu beantworten, müssen die folgenden Funktionen für die reellen Zahlen definiert werden:

 f(x) = 1 ; when x is odd integer
 f(x) = exp(-x^2)  ; elsewhere

und dann;

 f2(x) = 1  ; when x is even integer
 f2(x) = exp(-x^2) ;  elsewhere

Sie sind überhaupt nicht gleich x, aber beide Dichten für die gleiche Verteilung, daher werden die Dichten nicht eindeutig durch die (kumulative) Verteilung bestimmt. Wenn sich Dichten mit einer realen Domäne nur bei einer abzählbaren Menge von x-Werten unterscheiden, sind die Integrale gleich. Die mathematische Analyse ist nicht wirklich für schwache Nerven oder den genau festgelegten Verstand gedacht.

DWin
quelle

Ich bin mit der Aussage nicht einverstanden, dass "die Wahrscheinlichkeitsverteilungsfunktion ein Wahrscheinlichkeitsmaß nicht eindeutig bestimmt", wie Sie in Ihrer Eröffnungsfrage sagen. Es bestimmt es eindeutig.

Sei zwei Wahrscheinlichkeitsmassenfunktionen. Wenn Für jede messbare Menge ist fast überall. Dies bestimmt das PDF eindeutig (da es uns in der Analyse egal ist, ob sie sich auf eine Menge von Maß Null einigen). $f_1,f_2:\mathbb{R}\to [0,\infty)$

\int_{E} f_{1} = \int_{E} f_{2}

$\int_E f_1 = \int_E f_2$

E

$E$

f_{1} = f_{2}

$f_1=f_2$

Wir können die oben Integral in umschreiben, Wo eine integrierbare Funktion ist.

\int_{E} g = 0

$\int_E g = 0$

g = f_{1} - f_{2}

$g=f_1-f_2$

Definiere , also . Wir verwenden den bekannten Satz, dass wenn ein Integral einer nicht-negativen Funktion Null ist, die Funktion fast überall Null ist. Insbesondere ae auf . So ae auf . Wiederholen Sie nun das Argument in die andere Richtung mit $E = \{ x \in \mathbb{R} ~ | ~ g \geq 0 \}$ $\int_E g = 0$ $g=0$ $E$ $f_1 = f_2$ $E$ $F = \{ x\in \mathbb{R} ~ | ~ g \leq 0 \}$ . Wir werden ae auf . Somit ae auf . $f_1 = f_2$ $F$ $f_1 = f_2$ $E\cup F = \mathbb{R}$

Nicolas Bourbaki
quelle