In der Regel wird eine Wahrscheinlichkeitsverteilung über diskrete Variablen mit einer Wahrscheinlichkeitsmassenfunktion (PMF) beschrieben:
Bei der Arbeit mit kontinuierlichen Zufallsvariablen beschreiben wir Wahrscheinlichkeitsverteilungen mit einer Wahrscheinlichkeitsdichtefunktion (PDF) anstelle einer Wahrscheinlichkeitsmassenfunktion.
- Deep Learning von Goodfellow, Bengio und Courville
Allerdings Wolfram Mathworld ist PDF mit der Wahrscheinlichkeitsverteilung über diskrete Variablen zu beschreiben:
Ist das ein Fehler? oder macht es nicht viel aus?
Antworten:
Es ist kein Fehler: Bei der formalen Behandlung der Wahrscheinlichkeit ist eine Wahrscheinlichkeitsdichtefunktion über die Maßtheorie eine Ableitung des interessierenden Wahrscheinlichkeitsmaßes in Bezug auf ein "dominierendes Maß" (auch "Referenzmaß" genannt). Für diskrete Verteilungen über die ganzen Zahlen ist die Wahrscheinlichkeitsmassenfunktion eine Dichtefunktion in Bezug auf das Zählmaß . Da eine Wahrscheinlichkeitsmassenfunktion eine bestimmte Art von Wahrscheinlichkeitsdichtefunktion ist, werden Sie manchmal solche Referenzen finden, die sie als Dichtefunktion bezeichnen, und es ist nicht falsch, sie auf diese Weise zu bezeichnen.
Im gewöhnlichen Diskurs über Wahrscheinlichkeit und Statistik vermeidet man oft diese Terminologie und unterscheidet zwischen "Massenfunktionen" (für diskrete Zufallsvariablen) und "Dichtefunktionen" (für kontinuierliche Zufallsvariablen), um diskrete und kontinuierliche Verteilungen zu unterscheiden. In anderen Zusammenhängen, in denen ganzheitliche Aspekte der Wahrscheinlichkeit genannt werden, ist es oft besser, die Unterscheidung zu ignorieren und beide als "Dichtefunktionen" zu bezeichnen.
quelle
treatment
"In der formalen Behandlung der Wahrscheinlichkeit" Notation, Perspektive, Konvention oder etwas anderes?Zusätzlich zu der theoretischeren Antwort in Bezug auf die Maßtheorie ist es auch zweckmäßig, bei der statistischen Programmierung nicht zwischen pmfs und pdfs zu unterscheiden. Zum Beispiel hat R eine Fülle von eingebauten Verteilungen. Für jede Distribution hat es 4 Funktionen. Zum Beispiel für die Normalverteilung (aus der Hilfedatei):
R-Benutzer gewöhnen sich schnell an die
d,p,q,r
Präfixe. Es wäre ärgerlich , wenn man so etwas wie Tropfen zu tun hatd
und die Verwendungm
für zB die Binomialverteilung. Stattdessen ist alles so, wie es ein R-Benutzer erwarten würde:quelle
scipy.stats
unterscheidet, haben einige Objekte einepdf
Methode und andere einepmf
Methode. Es nervt mich wirklich!