Wie kann eine Wahrscheinlichkeitsverteilung divergieren?

8

Wie kann beispielsweise die Gammaverteilung nahe Null divergieren (für einen geeigneten Satz von Skalierungs- und Formparametern, z. B. Form und Skalierung ) und ihre Fläche immer noch gleich eins haben?=0.1=10

Nach meinem Verständnis sollte die Fläche einer Wahrscheinlichkeitsdichteverteilung immer gleich eins sein. Wenn Sie die Dirac-Delta-Verteilung nehmen, die bei Null divergiert, aber an keiner anderen Stelle Null ist, haben Sie eine Fläche gleich Eins.

Wenn Sie den Bereich einer divergierenden Gamma-Verteilung nehmen würden, könnten Sie ihn als den Bereich einer Dirac-Delta-Verteilung ausdrücken, plus etwas mehr, da er bei Gewicht ungleich Null hat , also größer als eins wäre.x0

Kann mir jemand erklären, wo meine Argumentation falsch ist?

Delphine
quelle
1
Es gibt viele Verteilungen (wie die Normalverteilung) , die auf der gesamten reellen Linie definiert sind, überall sind und dennoch eine begrenzte Fläche haben. Nehmen Sie (den Hauptquadranten) dieser Verteilung und drehen Sie sie um die Linie . Jetzt haben Sie eine Verteilung mit derselben Fläche, die bei divergiert . >0x=yx=0
BlueRaja - Danny Pflughoeft
Schauen Sie nach "Zeno's Paradox" - es könnte für Sie hier interessant sein
Shadowtalker
@ Delphine Zeit, die Theorie zu messen! Viel Glück!
Bdeonovic

Antworten:

8

Wenn Sie den Bereich einer divergierenden Gamma-Verteilung nehmen würden, könnten Sie ihn als den Bereich einer Dirac-Delta-Verteilung ausdrücken, plus etwas mehr, da er bei Gewicht ungleich Null hat , also größer als eins wäre.x0

Hier geht Ihre Argumentation schief: Sie können keine Funktion, die bei unendlich ist, automatisch als Delta-Verteilung plus etwas mehr ausdrücken . Wenn Sie dies mit tun könnten , wer sagt dann, dass Sie es nicht auch mit tun könnten ? Oder ? Oder irgendein anderer Koeffizient? Es ist genauso gültig zu sagen, dass diese Verteilungen für Null und bei unendlich sind ; warum nicht die gleiche Argumentation mit ihnen verwenden?δ ( x ) 2 δ ( x ) 10 - 10 δ ( x ) x 0 x = 0x=0δ(x)2δ(x)1010δ(x)x0x=0

Tatsächlich sollten Verteilungen (im mathematischen Sinne der Verteilungstheorie) eher als Funktionen von Funktionen betrachtet werden - Sie geben eine Funktion ein und erhalten eine Zahl heraus. Speziell für die Delta-Verteilung erhalten Sie, wenn Sie die Funktion eingeben, die Zahl . Verteilungen sind keine normalen Funktionen von Zahl zu Zahl. Sie sind komplizierter und leistungsfähiger als solche "normalen" Funktionen.f ( 0 )ff(0)

Diese Idee, eine Funktion in eine Zahl umzuwandeln, ist jedem bekannt, der es gewohnt ist, mit Wahrscheinlichkeit umzugehen. Beispielsweise kann die Reihe von Verteilungsmomenten - Mittelwert, Standardabweichung, Schiefe, Kurtosis usw. - als Regeln betrachtet werden, die eine Funktion (die Wahrscheinlichkeitsverteilung) in eine Zahl (das entsprechende Moment) verwandeln. Nehmen Sie zum Beispiel den Mittelwert / Erwartungswert. Diese Regel eine Wahrscheinlichkeitsverteilung in die Zahl , berechnet als Oder die Regel für die Varianz dreht in die Zahl , wobei E P [ x ] E P [ x ] = P ( x )P(x)EP[x]

EP[x]=P(x)x dx
P(x)σP2
σP2[x]=P(x)(xEP[x])2 dx
Meine Notation ist hier etwas seltsam, aber hoffentlich haben Sie die Idee. 1

Möglicherweise haben Sie etwas gemeinsam, das diese Regeln gemeinsam haben: In allen Fällen können Sie von der Funktion zur Zahl gelangen, indem Sie die Funktion mal eine andere Gewichtungsfunktion integrieren. Dies ist eine sehr verbreitete Methode zur Darstellung mathematischer Verteilungen. Es ist also natürlich zu fragen, ob es eine Gewichtungsfunktion , mit der Sie die Aktion einer solchen Delta-Verteilung darstellen können. Sie können leicht feststellen , dass , wenn es eine solche Funktion ist, ist es gleich sein muss bei jedem . Sie können jedoch keinen Wert fürδ(x)

fδ(x)f(x) dx
0x0δ(0)auf diese Weise. Sie können zeigen, dass es größer als jede endliche Zahl ist, aber es gibt keinen tatsächlichen Wert für , mit dem diese Gleichung unter Verwendung der Standardideen der Integration funktioniert. 2δ(0)

Der Grund dafür ist, dass die Delta-Verteilung mehr beinhaltet als nur Folgendes: Das " " ist irreführend. Es steht für eine ganze Reihe zusätzlicher Informationen über die Delta-Verteilung, die normale Funktionen einfach nicht darstellen können. Und deshalb kann man nicht sinnvoll sagen, dass die Gammaverteilung "mehr" ist als die Deltaverteilung. Sicher, bei jedem ist der Wert der Gammaverteilung größer als der Wert der Deltaverteilung, aber alle nützlichen Informationen über die Deltaverteilung sind an diesem Punkt bei , und diese Informationen sind zu reichhaltig und komplex, damit Sie sagen können, dass eine Distribution mehr ist als die andere.

{0,x0,x=0
x>0x=0

Technische Details

1 Tatsächlich können Sie Dinge umdrehen und sich die Wahrscheinlichkeitsverteilung selbst als mathematische Verteilung vorstellen. In diesem Sinne ist die Wahrscheinlichkeitsverteilung eine Regel, die eine Gewichtungsfunktion wie oder auf eine Zahl bzw. . Wenn Sie so denken, ist die Standardnotation etwas sinnvoller, aber ich denke, die Gesamtidee ist für einen Beitrag über mathematische Verteilungen etwas weniger natürlich.x(xE[x])2E[x]σx2

2 Insbesondere gehe ich von "Standardideen der Integration" über die Riemann-Integration und die Lebesgue-Integration aus , die beide die Eigenschaft haben, dass zwei Funktionen, die sich nur an einem einzigen Punkt unterscheiden, dasselbe Integral haben müssen (bei gleichen Grenzen). Wenn es eine Funktion gäbe, würde sie sich nur an einem Punkt von der Funktion unterscheiden , nämlich , und daher müssten die Integrale der beiden Funktionen immer gleich sein. gibt also keine Nummer, der Sie zuweisen können , mit dem der Effekt der Delta-Verteilung reproduziert wird.δ(x)0x=0

abδ(x)f(x) dx=ab(0)f(x) dx=0
δ(0)
David Z.
quelle
10

Das Dirac - Delta ist wirklich nicht allzu hilfreich hier (obwohl es ist interessant), weil die Gamma - Verteilung eine kontinuierliche Dichte hat, während die Dirac etwa ist als nicht-kontinuierliche , wie Sie bekommen können.

Sie haben Recht, dass das Integral einer Wahrscheinlichkeitsdichte eins sein muss (ich werde mich nur an die auf der positiven Achse definierten Dichten halten).

0f(x)dx=1.

Im Gamma-Fall divergiert die Dichte als , so dass wir ein sogenanntes falsches Integral haben . In einem solchen Fall wird das Integral als Grenze definiert, wenn sich die Integrationsgrenzen dem Punkt nähern, an dem der Integrand nicht definiert ist.f(x)x0

0f(x)dx:=lima0af(x)dx,

solange diese Grenze besteht .

(Übrigens verwenden wir denselben Missbrauch Notations Bedeutung des Symbols zu geben „ “, die als die Grenze des Integrals definiert als , wiederum solange dies Grenzwert existiert also in diesem speziellen Fall haben wir zwei problematischen Punkte haben -. , wo der Integrand nicht definiert ist, und ., wo wir das Integral nicht direkt auswerten können wir in beiden Fällen mit Grenzen arbeiten müssen).bb0

Speziell für die Gamma-Verteilung umgehen wir das Problem. Wir definieren zuerst die Gamma-Funktion wie folgt:

Γ(k):=0yk1eydy.

Als nächstes beweisen wir, dass diese Definition im Sinne der oben beschriebenen unterschiedlichen Grenzen tatsächlich Sinn macht. Der Einfachheit halber können wir hier bei bleiben , obwohl die Definition auch auf (viele) komplexe Werte erweitert werden kann . Diese Prüfung ist eine Standardanwendung von Kalkül und eine schöne Übung.k>0k

Als nächstes ersetzen wir für und durch die Änderung der Variablen Formel erhaltenx:=θyθ>0

Γ(k)=0xk1exθθkdx,

von dem wir das bekommen

1=0xk1exθΓ(k)θkdx.

Das heißt, der Integrand integriert sich in eins und ist daher eine Wahrscheinlichkeitsdichte. Wir nennen es die Gamma-Verteilung mit Form und Skala .kθ

Jetzt merke ich, dass ich hier wirklich das Geld gegeben habe. Das Kernstück des Arguments liegt in der Tatsache, dass die obige Definition der Gammafunktion sinnvoll ist. Dies ist jedoch ein einfacher Kalkül, keine Statistik, daher fühle ich mich nur leicht schuldig, wenn ich Sie auf Ihr Lieblingslehrbuch für Kalkül und das Gammafunktions-Tag bei Math.SO verweise , insbesondere auf diese Frage und diese Frage .

Stephan Kolassa
quelle
Ich sollte in der Tat zu meinen Büchern zurückkehren, es ist eine Weile her! Danke für die ausführliche Antwort!
Delphine
7

Betrachten Sie eine Standard-Exponentialdichte und betrachten Sie eine grafische Darstellung von gegen (linkes Feld im folgenden Diagramm).f(x)=exp(x),x>0y=f(x)x

Vermutlich ist es nicht unergründlich, dass es für alle eine positive Dichte gibt, die Fläche jedoch .x>01

Tauschen wir nun und ... das heißt oder gegen . Dies ist eine gültige Dichte, die asymptotisch zur Achse ist (also unbegrenzt als ), aber ihre Fläche ist eindeutig identisch mit der Exponentialdichte (dh die Fläche unter der Kurve muss immer noch 1 sein - wir haben nur reflektiert die Form und Reflexion ist flächenerhaltend).y x = exp ( - y ) y = - ln ( x ) 0 < x 1 y x 0xyx=exp(y)y=ln(x)0<x1yx0

Geben Sie hier die Bildbeschreibung ein

Es ist klar, dass Dichten unbegrenzt sein können, aber Fläche 1 haben.

Glen_b -Reinstate Monica
quelle
4

Dies ist eher eine Kalkülfrage als eine Statistik. Sie fragen sich, wie eine Funktion, die bei einigen Werten ihres Arguments ins Unendliche geht, immer noch eine endliche Fläche unter der Kurve haben kann?

Das ist eine berechtigte Frage. Wenn Sie beispielsweise anstelle der Gammafunktion eine Übertreibung vorgenommen haben: , für konvergiert der Bereich unter der Kurve nicht, sondern ist unendlich.y=1/xx=[0,)

Geben Sie hier die Bildbeschreibung ein

Es ist also ein Wunder, dass eine gewichtete Summe sehr großer oder sogar unendlicher Zahlen zu einer endlichen Zahl konvergiert. Die Summe wird gewichtet, denn wenn Sie sich die Integraldefinition von Riemann ansehen, könnte dies eine Summe wie diese sein: Je nachdem, welche Punkte Sie auswählen, können die Gewichte klein oder groß sein. Wenn Sie sich 0 , wird größer, aber auch kleiner. In diesem Wettbewerb gewinnt und das Integral konvergiert nicht.

01/xdx=limni=0nΔxixi
xiΔxi1/xiΔxi1/xi

Bei der Gamma-Verteilung schrumpft schneller als Gamma PDF und der Bereich ist endlich. Es ist eine reine Berechnung, um zu sehen, wie genau sie gegen 1 konvergiert.Δxi

Aksakal
quelle
0

Schauen Sie sich das folgende Beispiel an. Beachten Sie, dass für jedes endliche ,N

0N1xdx=log(N)log(0)

aber ist undefiniert, so dass das Integral in gewissem Sinne (dies hat eine Grenze, aber ignoriere sie). Aberlog(0)

0N1xdx=N0=N

Im Allgemeinen basiert dies auf der Idee, dass

1xpdx=x1p

Wenn also ist, sagt Ihnen der Grundsatz der Analysis, dass das Integral endlich ist. Die Idee ist also, dass es langsam genug divergiert (wobei die Geschwindigkeit ist), dass der Bereich immer noch begrenzt ist.p1p>0p

Dies ähnelt der Konvergenz von Reihen. Denken Sie daran, dass wir das durch den p-Test haben

01xp

konvergiert genau dann, wenn . In diesem Fall brauchen wir schnell genug, wobei wiederum die Geschwindigkeit und der Wendepunkt ist.x pp 1p>1xpp1

Warum kann das eine tatsächliche Sache sein? Denken Sie an die Koch-Schneeflocke . In diesem Beispiel fügen Sie den Umfang der Schneeflocke so hinzu, dass die Fläche langsam wächst. Dies liegt an der Tatsache, dass, wenn Sie ein gleichseitiges Dreieck mit Seiten der Größe erstellen, der Umfang 1 ist, während die Fläche 11311230.05. Da die Fläche so viel kleiner als der Umfang ist (es ist die Multiplikation zweier kleiner Zahlen anstelle der Addition!), Können Sie Dreiecke so hinzufügen, dass der Umfang unendlich wird, während die Fläche endlich bleibt. Um dies zu tun, müssen Sie eine Geschwindigkeit wählen, bei der die Dreiecke auf Null gehen, und wie Sie wahrscheinlich inzwischen erraten haben, gibt es eine Geschwindigkeit, bei der von zu langsam und unendlicher Fläche zu schnell genug zu endlicher Fläche gewechselt wird.

Insgesamt sagt uns der Kalkül, dass nicht alle Singularitäten (die "Nullpunkte" wie Null sind) gleich sind. Es gibt große Unterschiede, die auf der "lokalen Geschwindigkeit" der Singularität beruhen. einfach eine Singularität, die "langsam genug" ist, dass die Fläche endlich ist. Wenn Sie mehr über das "Warum" von Singularitäten erfahren möchten, die so funktionieren, können Sie sich in der komplexen Analyse und ihrer Untersuchung der Singularitäten komplexer analytischer Funktionen (von denen ist) mit viel mehr Details befassen .ΓΓΓ

Chris Rackauckas
quelle
Das sind viele gute Punkte, danke! Ich werde mich daran erinnern
Delphine