Rolle der Dirac-Funktion in Partikelfiltern

7

Partikelnäherungen an Wahrscheinlichkeitsdichten werden häufig als gewichtete Summe von Dirac-Funktionen eingeführt

p(x)i=1Nωiδ(xxi)

mit den Gewichten

ωip(xi)q(xi)

normalisiert, so dass sie zur Einheit summieren; Dabei ist die Wichtigkeitsdichte. Ich verstehe , daß die Dirac - Funktion an einem Punkt unendlich groß wird , dh und dass es an anderer Stelle Null, dh . Ich verstehe auch, dass die über den Massenpunkt integrierte Dirac-Funktion den Wert der Einheit annimmt.q()pδ(p)=δ(x)=0 xp

Meine Fragen sind:

  1. Welche Beziehung besteht zwischen der Unterstützung der Partikelnäherung und der Dirac-Funktion?
  2. Warum wird ein Summationszeichen verwendet, wenn nur einen Wert von 0 oder unendlich ergeben kann? Sollte dies nicht stattdessen ein Integral sein?δ
  3. Wie kann der Begriff der Unterstützung einer Funktion auf eine Reihe von Punkten (z. B. ) erweitert werden, die selbst keine Funktion sind?xt(i)
  4. Wie kann eine Darstellung einer Wahrscheinlichkeitsdichtefunktion aus einer gewichteten Summe von s entstehen, die selbst nur Werte von Null oder Unendlich annehmen?δ()

Vielen Dank für eventuelle Klarstellungen.

Constantin
quelle
1
Der zugehörige Thread unter stats.stackexchange.com/questions/73623 könnte diese Fragen beleuchten. (Es betrifft genau die gleiche Situation, aber mit einheitlichen Gewichten.)
whuber

Antworten:

6

@ user20160 hat Ihnen bereits eine nette Antwort auf Ihre (1) - (3) Fragen gegeben, aber die letzte scheint noch nicht vollständig beantwortet zu sein.

  1. Wie kann eine Darstellung einer Wahrscheinlichkeitsdichtefunktion aus einer gewichteten Summe von s entstehen, die selbst nur Werte von Null oder Unendlich annehmen?δ()

Lassen Sie mich mit dem Zitieren von Wikipedia beginnen, da es in diesem Fall eine ziemlich klare Beschreibung enthält (beachten Sie die Fettdrucke, die ich hinzugefügt habe):

Das Dirac-Delta kann lose als eine Funktion auf der realen Linie betrachtet werden, die überall Null ist, außer am Ursprung, wo es unendlich ist.

δ(x)={+,x=00,x0

und die auch gezwungen ist, die Identität zu befriedigen

δ(x)dx=1

Dies ist lediglich eine heuristische Charakterisierung. Das Dirac-Delta ist keine Funktion im herkömmlichen Sinne, da keine auf den reellen Zahlen definierte Funktion diese Eigenschaften hat . Die Dirac-Delta-Funktion kann entweder als Verteilung oder als Maß genau definiert werden.

Darüber hinaus bietet Wikipedia eine formalere Definition und viele Beispiele. Ich würde Ihnen daher empfehlen, den gesamten Artikel durchzugehen. Lassen Sie mich ein Beispiel daraus zitieren:

In der Wahrscheinlichkeitstheorie und -statistik wird die Dirac-Delta-Funktion häufig verwendet, um eine diskrete Verteilung oder eine teilweise diskrete, teilweise kontinuierliche Verteilung unter Verwendung einer Wahrscheinlichkeitsdichtefunktion (die normalerweise zur Darstellung vollständig kontinuierlicher Verteilungen verwendet wird) darzustellen. Beispielsweise kann die Wahrscheinlichkeitsdichtefunktion einer diskreten Verteilung, die aus Punkten mit entsprechenden Wahrscheinlichkeiten , wie geschrieben werdenf(x)x={x1,,xn}p1,,pn

f(x)=i=1npiδ(xxi)

Diese Gleichung besagt, dass wir die Summe über kontinuierliche Verteilungen , deren gesamte Masse um . Wenn Sie versuchen möchten, sich -Verteilungen als kumulative Verteilungsfunktionen vorzustellen , muss dies der Fall seinnδxi=δ(xxi)xiδxi

Fxi(x)={0if x<xi1if xxi

So können wir die vorherige Dichte in die kumulative Verteilungsfunktion umschreiben

F(x)=i=1npiFxi(x)=i=1npi1xxi

Dabei ist eine Indikatorfunktion, die auf . Beachten Sie, dass dies im Grunde eine kategorische Verteilung in Verkleidung ist. Darüber hinaus können Sie das Dirac-Delta als beliebige Funktion definieren1xxixi

f(x)δ(xxi)dx=f(xi)

es "funktioniert" also als kontinuierliche Version der Anzeigefunktion.

Die Nachricht zum Mitnehmen ist, dass das Dirac-Delta keine Standardfunktion ist. Es ist auch nicht gleich unendlich bei Null - wenn es so wäre, wäre es nutzlos, weil unendlich keine Zahl ist, so dass wir keine arithmetischen Operationen darüber ausführen könnten. Sie können sich Dirac-Delta einfach als eine Indikatorfunktion vorstellen, die auf ein , das kontinuierlich ist und sich zur Einheit integriert. Keine schwarze Magie, es ist nur eine Möglichkeit, den Kalkül zu hacken, um mit diskreten Werten umzugehen.xi

Tim
quelle
4

Welche Beziehung besteht zwischen der Unterstützung der Partikelnäherung und der Dirac-Funktion?

Die Verteilung wird als gewichtete Summe der Delta-Funktionen angenähert. Die Unterstützung der Approximation ist also die Vereinigung der Unterstützung der Delta-Funktionen. Jede Delta-Funktion ist überall Null, mit Ausnahme eines einzelnen Punktes ( ), dessen Wert unendlich ist. Die Unterstützung jeder Delta-Funktion ist also dieser einzelne Punkt, und die Unterstützung der ungefähren Verteilung ist die Menge der Punktext(i){xt(i)}i=1N

Warum wird ein Summationszeichen verwendet, wenn nur einen Wert von 0 oder unendlich ergeben kann? Sollte dies nicht stattdessen ein Integral sein?δ

Die Summe dient dazu, die Verteilung als gewichtete Summe von Delta-Funktionen auszudrücken. Dies bedeutet nur: "Platziere eine Delta-Funktion an jedem Punkt und skaliere ihre Amplitude mit ." Die Verteilung ist kontinuierlich, so dass ihr Wert an jedem Punkt ist die Wahrscheinlichkeitsdichte , nicht die Wahrscheinlichkeit. Wir würden die Dichte über eine Region integrieren, um die zugehörige Wahrscheinlichkeit zu erhalten. Das Integral jeder skalierten Delta-Funktion ist . Das heißt , die Wahrscheinlichkeit für jeden Punkt ist , und die Wahrscheinlichkeit , einen anderen Wert 0 ist .xt(i)πt(i)πt(i)xt(i)πt(i)

Hier ist ein Beispiel für die Approximation einer kontinuierlichen Verteilung mithilfe von Delta-Funktionen. Die Verteilung ist eine Gaußsche Verteilung. wird unter Verwendung der Verteilung approximiert , die eine Summe von 50 skalierten Delta-Funktionen ist. Die Positionen der Delta-Funktionen werden aus abgetastet .ggfg

Geben Sie hier die Bildbeschreibung ein

Aus der Sicht sehen die PDFs nicht sehr ähnlich aus, da keine schöne Form hat, die wir sehen können. Die Delta-Funktionen sind jedoch in Regionen, in denen eine höhere Dichte aufweist, enger zusammengepackt . Sobald wir anfangen, Integrale zu nehmen, wird die Ähnlichkeit offensichtlicher. Zum Beispiel sind die CDFs merklich ähnlich. Der Mittelwert, die Varianz usw. sind ebenfalls ähnlich. Die Qualität der Approximation wird sich verbessern, wenn die Anzahl der Abtastwerte / Delta-Funktionen zunimmt.fg

Wie kann der Begriff der Unterstützung einer Funktion auf eine Reihe von Punkten (z. B. ) erweitert werden, die selbst keine Funktion sind?xt(i)

Support ist ein Konzept, das für Funktionen und nicht für Mengen definiert ist. Die Unterstützung einer Funktion ist der Satz von Eingängen, für die der Ausgang ungleich Null ist. Wie oben, wenn wir eine Funktion als eine Summe von Deltafunktionen liegt an jedem Punkt in einem Satz definieren ist, ist die Unterstützung dieser Funktion . Wir können auch die Indikatorfunktion von . Angenommen, ist eine Teilmenge einer größeren Menge (z. B. der reellen Zahlen). Die ist auf definiert . Es nimmt den Wert wenn , andernfalls . So ist die Unterstützung der Indikatorfunktion .SSSSLIS(x)L1xS0S

user20160
quelle
Vielen Dank für die Klarstellungen. Was ich immer noch nicht verstehe, ist, wie eine Darstellung einer Wahrscheinlichkeitsdichtefunktion aus einer gewichteten Summe von δ (⋅) s entstehen kann, die selbst nur Werte von Null oder Unendlich annehmen.
Constantin
1
Dies liegt daran, dass wir eine kontinuierliche Verteilung mit einer diskreten approximieren.
JDL
@ user20160 Wie haben Sie die ungefähre CDF berechnet?
Tintinthong
1
@tintinthong Dies ist die 'empirische CDF', die durch Integration des aus Delta-Funktionen zusammengesetzten PDF erhalten wird. Sein Wert an jedem Punkt ist nur der Bruchteil der Delta-Funktionen, deren Positionen . en.wikipedia.org/wiki/Empirical_distribution_functionxx
user20160
@Constantin Diese Antwort ist etwas spät. Der Grund, warum Sie auf diese Weise eine kontinuierliche Verteilung approximieren können, ist, dass die Delta-Funktionen in Regionen, in denen die wahre Dichte hoch ist, dichter gepackt sind
user20160
2

Wie kann eine Darstellung einer Wahrscheinlichkeitsdichtefunktion aus einer gewichteten Summe von δ (⋅) s entstehen, die selbst nur Werte von Null oder Unendlich annehmen?

Stellen Sie sich Diracs Delta-Funktion als Brücke zwischen diskreten und kontinuierlichen Werten vor. Dirac hat sie entwickelt, um seine Mathematik zu vereinfachen, indem er kontinuierliche mathematische Werkzeuge auf diskrete Größen anwendet. Ich denke an Diracs Delta in genau den gleichen Situationen, in denen es zu umständlich ist, mit diskreten Werten umzugehen.

In Ihrem Beispiel wollte jemand die Wahrscheinlichkeitsdichtefunktion haben. Großartig! Das Problem ist jedoch, dass Ihre Eingaben diskrete Beobachtungen sind. Also wusste dieser Typ über Diracs Funktion Bescheid und steckte sie ein:

p(x)i=1Nωiδ(xxi)

Um diesen Ausdruck zu verstehen, bedenken Sie, wie Diracs Delta definiert ist:

f(x)δ(xx0)dx=f(x0)
δ(x)0,x0

Beachten Sie, dass es nicht so definiert ist, wie Sie es beschrieben haben:

Die Dirac-Funktion wird an einem Punkt pp unendlich groß, dh δ (p) = ∞, und an anderer Stelle ist sie Null.

Dies ist nicht der richtige Weg, um sich eine Dirac-Funktion vorzustellen. Stellen Sie es sich immer als ein Integral vor, dessen Zweck darin besteht, den diskreten Wert bei mit dem kontinuierlichen Ausdruck (Integral) zu verknüpfen .x0dx

Wenden Sie nun ein Integral auf Ihre Gleichung an:

p(x)dx(i=1Nωiδ(xxi))dx=iωi

Wenn Sie das Dirac'-Delta nicht hätten und das Integral auf eine Summe anwenden würden, würden Sie ein undefiniertes Integral erhalten:

(i=1Nωi)dx=

Zusammenfassend lässt sich sagen, dass Diracs Delta-Zweck darin besteht, diskrete Größen in den kontinuierlichen Raum zu bringen, und Ihre Definition von zeigt genau das. Es konstruiert die kontinuierliche Dichtefunktion aus diskreten Werten.p(x)N

Auch hier ist es irreführend, sich die Dirac-Funktion als "unendlich bei und überall Null" vorzustellen. Diese Beschreibung bringt nichts Nützliches in Bezug auf die Intuition. Lass es fallen.x0

So definierte Diract selbst seine Funktion in " The Principles of Quantum Mechanics ": Geben Sie hier die Bildbeschreibung ein

So beschreibt er den Zweck der Funktion, bemerkt, wie er das Wort "Integrand" wiederholt und "Bequemlichkeit" betont: Geben Sie hier die Bildbeschreibung ein

Aksakal
quelle
1

Ich denke, Ihre Verwirrungen sind alle das Ergebnis des Denkens des Dirac-Deltas als Funktion. Dies ist nicht der Fall (siehe Wikipedia-Artikel https://en.wikipedia.org/wiki/Dirac_delta_function ).

Die Delta-Funktion ist als mathematisches Objekt nur dann sinnvoll, wenn sie innerhalb eines Integrals erscheint. Aus dieser Perspektive kann das Dirac-Delta normalerweise so manipuliert werden, als wäre es eine Funktion.

Wie @Tim zitiert, kann die Dirac-Delta-Funktion entweder als Verteilung oder als Maß genau definiert werden.

Dies ist lediglich eine heuristische Charakterisierung. Das Dirac-Delta ist keine Funktion im herkömmlichen Sinne, da keine auf den reellen Zahlen definierte Funktion diese Eigenschaften hat. Die Dirac-Delta-Funktion kann entweder als Verteilung oder als Maß genau definiert werden.

Ich denke, es ist einfacher, es als Maßnahme zu betrachten (dh im Wesentlichen etwas, gegen das Sie sich integrieren). Also gegeben eine Funktion f,

μ(f):=f(x) dμ(x)

Wenn Sie eine Dichte p (x) haben, induziert dies ein Maß :P

P(f)=f(x) p(x)dx

und die Delta-Funktion induziert ein Maß so dass νν(f)=f(0)

Die Funktionsnotation hilft also nur beim Addieren von Kennzahlen (Q2). dh was es wirklich sagt ist: woμ(f):=i=1nνxi(f)

νxi(f)=f(xi)

Dieser Standpunkt verdeutlicht auch die Unterstützungsfrage. Die Unterstützung wird mit beliebigen Funktionen definiert: Alle Funktionen f ohne Unterstützung bei Null haben = 0 Unterstützung einer Verteilungμ(f)

Wie im Wikipedia-Artikel erwähnt, kann die Delta-Funktion konstruktiv als Grenze von durch Gaußschen induzierten Maßen mit einem Mittelwert bei Null und einer verschwindenden Standardabweichung ( ) angesehen werden (bezeichnet Gaußsches PDF als ).σg(x;μ;σ)

ν(f)=limσ0f(x)g(x;0,σ)dx

seanv507
quelle
Wenn also ein Papier die Monte-Carlo-Darstellung einer Verteilung als bezeichnet, ist das formal falsch? 1/Nδ(x)
Constantin
Ich würde es sagen, aber es hilft immer, die Aussage im Kontext zu sehen
seanv507