Macht Wolfram Mathworld einen Fehler bei der Beschreibung einer diskreten Wahrscheinlichkeitsverteilung mit einer Wahrscheinlichkeitsdichtefunktion?

14

In der Regel wird eine Wahrscheinlichkeitsverteilung über diskrete Variablen mit einer Wahrscheinlichkeitsmassenfunktion (PMF) beschrieben:

Bei der Arbeit mit kontinuierlichen Zufallsvariablen beschreiben wir Wahrscheinlichkeitsverteilungen mit einer Wahrscheinlichkeitsdichtefunktion (PDF) anstelle einer Wahrscheinlichkeitsmassenfunktion.

- Deep Learning von Goodfellow, Bengio und Courville

Allerdings Wolfram Mathworld ist PDF mit der Wahrscheinlichkeitsverteilung über diskrete Variablen zu beschreiben:

Bildbeschreibung hier eingeben

Ist das ein Fehler? oder macht es nicht viel aus?

czlsws
quelle
5
Das ist meiner Meinung nach schlampig, aber nicht sehr wichtig. Es ist sogar vertretbar, wenn sie sich der Wahrscheinlichkeit vom Standpunkt der Maßtheorie nähern, obwohl dies für eine Einführung in das Werfen einer Münze ein wenig viel zu sein scheint. (Komisch genug, sie scheinen keinen Artikel über PMFs zu haben.)
Dave
9
Eine PMF ist eine Dichte gegen das Zählmaß
Xi'an
3
Wenn Sie die Wahrscheinlichkeitstheorie auf der Ebene des durch 3 Elemente angegebenen Messbereichs diskutieren, unterscheiden sich pdf und pmf nicht, sodass die pmf gelöscht wird. Alle Distributionen können als pdf angegeben werden. wolfram ist eine mathematische website, daher ist es nicht verwunderlich, dass sie hochrangige mathematik verwenden, um über wahrscheinlichkeiten zu sprechen. Hier ist gute freie Lektüre. stat.washington.edu/~pdhoff/courses/581/LectureNotes/…
user158565

Antworten:

30

Es ist kein Fehler: Bei der formalen Behandlung der Wahrscheinlichkeit ist eine Wahrscheinlichkeitsdichtefunktion über die Maßtheorie eine Ableitung des interessierenden Wahrscheinlichkeitsmaßes in Bezug auf ein "dominierendes Maß" (auch "Referenzmaß" genannt). Für diskrete Verteilungen über die ganzen Zahlen ist die Wahrscheinlichkeitsmassenfunktion eine Dichtefunktion in Bezug auf das Zählmaß . Da eine Wahrscheinlichkeitsmassenfunktion eine bestimmte Art von Wahrscheinlichkeitsdichtefunktion ist, werden Sie manchmal solche Referenzen finden, die sie als Dichtefunktion bezeichnen, und es ist nicht falsch, sie auf diese Weise zu bezeichnen.

Im gewöhnlichen Diskurs über Wahrscheinlichkeit und Statistik vermeidet man oft diese Terminologie und unterscheidet zwischen "Massenfunktionen" (für diskrete Zufallsvariablen) und "Dichtefunktionen" (für kontinuierliche Zufallsvariablen), um diskrete und kontinuierliche Verteilungen zu unterscheiden. In anderen Zusammenhängen, in denen ganzheitliche Aspekte der Wahrscheinlichkeit genannt werden, ist es oft besser, die Unterscheidung zu ignorieren und beide als "Dichtefunktionen" zu bezeichnen.

Setzen Sie Monica wieder ein
quelle
Danke für deine Antwort. Bedeutet treatment"In der formalen Behandlung der Wahrscheinlichkeit" Notation, Perspektive, Konvention oder etwas anderes?
Czlsws
Wenn ich hier über die "formale Behandlung" spreche, beziehe ich mich auf die moderne Grundlage der Wahrscheinlichkeitstheorie, die eine Teilmenge der Maßtheorie ist. Das ist die mathematische Theorie, die als formale Untermauerung der Wahrscheinlichkeit akzeptiert wird.
Setzen Sie Monica
"eine Wahrscheinlichkeitsdichtefunktion ist eine Ableitung des Wahrscheinlichkeitsmaßes von Interesse" Es scheint mir, dass es in gewissem Sinne eher ein "Anti-Integral" als eine Ableitung ist. Es gibt diskontinuierliche PDFs, wie die Gleichverteilung, und diskrete Verteilungen können als Summen von Dirac-Delta-Funktionen behandelt werden. In diesen Fällen müsste man das Konzept eines Derivats weit über das übliche Verständnis hinaus verallgemeinern, damit es angewendet werden kann.
Akkumulation
@Akkumulation - wie ist die Gleichverteilung diskontinuierlich? ... und die Maßtheorie ist eine viel allgemeinere Behandlung von Integration und Differenzierung, als es das gewöhnliche Verständnis von Calc I und II vorsieht.
Bogenschütze
@Akkumulation: Ja, das ist eine faire Charakterisierung, und genau das wird getan. Technisch ist die Dichte ein Radon-Nikodym-Derivat , das in der Tat eine Art "Anti-Integral" des von Ihnen beschriebenen Typs ist.
Setzen Sie Monica
5

Zusätzlich zu der theoretischeren Antwort in Bezug auf die Maßtheorie ist es auch zweckmäßig, bei der statistischen Programmierung nicht zwischen pmfs und pdfs zu unterscheiden. Zum Beispiel hat R eine Fülle von eingebauten Verteilungen. Für jede Distribution hat es 4 Funktionen. Zum Beispiel für die Normalverteilung (aus der Hilfedatei):

dnorm gives the density, pnorm gives the distribution function, qnorm gives the quantile function, and rnorm generates random deviates.

R-Benutzer gewöhnen sich schnell an die d,p,q,rPräfixe. Es wäre ärgerlich , wenn man so etwas wie Tropfen zu tun hat dund die Verwendung mfür zB die Binomialverteilung. Stattdessen ist alles so, wie es ein R-Benutzer erwarten würde:

dbinom gives the density, pbinom gives the distribution function, qbinom gives the quantile function and rbinom generates random deviates.
John Coleman
quelle
3
scipy.statsunterscheidet, haben einige Objekte eine pdfMethode und andere eine pmfMethode. Es nervt mich wirklich!
Matthew Drury