Hat diese Distribution einen Namen? Oder was ist ein stochastischer Prozess, der ihn erzeugen könnte?

9

Eine diskrete Verteilung mit Massenfunktion

p(x;k)=k(x+k)(x+k1),x=1,2,

erscheint auf Seite 9 dieses Papiers .

Für es eine Yule-Simon-Verteilung mit , aber ich habe keine anderen Beispiele gefunden.k=1ρ=1

Hat es einen Namen? Erscheint es in anderen Kontexten? Gibt es einen einfachen stochastischen Prozess, der ihn erzeugen könnte?

Simon Byrne
quelle

Antworten:

13

Es ist ein diskretes Potenzgesetz.

(Dies ist eine Beschreibung - deren Bedeutung im Folgenden präzisiert wird - und kein technischer Begriff. Der Ausdruck "Gesetz der diskreten Potenz" hat eine etwas andere technische Bedeutung, wie von @Cardinal in den Kommentaren zu dieser Antwort angegeben.)

Um dies zu sehen, beachten Sie, dass die Teilbruchzerlegung geschrieben werden kann

p(x;k)=k(x+k)(x+k1)=11+(x1)/k11+x/k.

Die CDF-Teleskope in geschlossener Form:

CDF(i)=x=1ip(x;k)=[11+0/k11+1/k]+[11+1/k11+2/k]++[11+(i1)/k11+i/k]=11+0/k+[11+1/k+11+1/k]+[11+2/k++11+(i1)/k]11+i/k=1+0++011+i/k=ii+k.

(Da dies leicht invertiert werden kann, bietet es übrigens sofort eine effiziente Möglichkeit, Zufallsvariablen aus dieser Verteilung zu generieren: Berechnen einfach wobei gleichmäßig auf verteilt ist. .)ku1uu(0,1)

Die Differenzierung dieses Ausdrucks in Bezug auf zeigt, wie die CDF als Integral geschrieben werden kann.i

CDF(i)=ii+k=0idt/k(1+t/k)2=x=1ix1xdt/k(1+t/k)2,

woher

p(x;k)=x1xdt/k(1+t/k)2.

Diese Form des Schreibens zeigt als Skalenparameter für die Familie der (kontinuierlichen) Verteilungen, die durch die Dichte bestimmt werdenk

f(ξ)dξ=(1+ξ)2dξ

und zeigt, wie die diskretisierte Version von (skaliert mit ) ist, die durch Integrieren der kontinuierlichen Wahrscheinlichkeit über das Intervall von bis . Das ist offensichtlich ein Potenzgesetz mit Exponent . Diese Beobachtung gibt Ihnen einen Einblick in umfangreiche Literatur zu Potenzgesetzen und deren Entstehung in Wissenschaft, Technik und Statistik, die möglicherweise viele Antworten auf Ihre letzten beiden Fragen enthält.p(x;k) fkx1x2

whuber
quelle
(+1) Aus der Wahrscheinlichkeitsmassenfunktion geht hervor, dass als , was ausreicht, um zu schließen, dass es sich um eine Potenzgesetzverteilung handelt. Tatsächlich ist als . p(x;k)kx2xp(x;k)x2/k1x
Kardinal
@cardinal Du hast Recht, aber es gibt eine Begrenzung auf dieses Argument: es zeigt nur , dass ist asymptotisch ein Potenzgesetz. Die Berechnungen zeigen, dass es sich genau um eine diskretisierte Version eines Potenzgesetzes handelt. p
whuber
Ich bin mir nicht ganz sicher, welchen Unterschied Sie machen wollen. Leider habe ich nicht die Gelegenheit bekommen, sorgfältig darüber nachzudenken, aber es scheint, dass Sie eine diskrete Potenzgesetzverteilung als eine diskretisierte Version einer kontinuierlichen Potenzgesetzverteilung definieren. Interpretiere ich Ihren Kommentar richtig? Wenn ich in der Literatur einen Hinweis auf diskrete Potenzgesetze sehe, scheint die übliche Definition jedenfalls die schwächere (dh asymptotische) zu sein, die ich verwendet habe. (Fortsetzung)
Kardinal
(Forts.) Andererseits scheint eine Zipf-Verteilung so rein wie möglich von einem diskreten Potenzgesetz zu sein, aber ich glaube nicht, dass sie als Diskretisierung eines kontinuierlichen Potenzgesetzes erzeugt werden kann. Habe ich deine Absicht falsch interpretiert? (Übrigens, Ihre obige Entwicklung ist ganz nett. Die Erkennung der Teleskopsumme für das PDF ist großartig, ebenso wie die Erkennung eines einfachen Stichprobenplans.)
Kardinal
10

Okay, nach ein bisschen mehr Nachforschungen habe ich ein paar Details gefunden.

Es ist ein Sonderfall einer kontinuierlichen Mischung einer geometrischen Verteilung mit einer Beta, die als Beta-geometrische Verteilung bezeichnet werden kann . Insbesondere wenn: und: dann hat die Randverteilung von diese Verteilung. Als solches ist es ein Sonderfall einer Beta-negativen Binomialverteilung .

PBeta(1,k)
X|PGeometric(P)
Y=X+1

Es hat ein paar andere interessante Eigenschaften:

  • Es hat einen unendlichen Mittelwert
  • Es beschreibt seine eigene Schwanzverteilung: Wenn diese Verteilung mit dem Parameter , dann ist hat den Parameter .XkXt|X>tt+k
Simon Byrne
quelle