Einfache Frage, aber eine, auf die ich anderswo keine genaue Antwort finden konnte. Wie viele Momente einer diskreten Wahrscheinlichkeitsverteilung mit endlicher Unterstützung sind erforderlich, um die genaue Wahrscheinlichkeitsmassenfunktion eindeutig zu identifizieren? Angenommen, wir wissen, dass die Verteilung höchstens Punkte innerhalb eines begrenzten Intervalls unterstützt (für meine Zwecke ist das Intervall ), aber wir kennen die Punkte nicht.
Ist es so, dass die Verteilung durch eine bestimmte Anzahl von Momenten eindeutig identifiziert wird? Meine Hypothese ist, dass es die ersten Momente sein können. Da wir Massenpunkte und ihre individuellen Wahrscheinlichkeiten identifizieren müssen , könnte man denken, wir brauchen Gleichungen und jeder Moment gibt uns eine Gleichung plus die Einschränkung, dass die Wahrscheinlichkeiten zu summieren . Aber diese Gleichungen sind in den Massenpunkten nicht linear, so dass mir nicht sofort klar ist, dass wir identifiziert sind.
Ich bin mir des Hausdorff-Moment-Problems bewusst , daher weiß ich, dass eine unendliche Folge von Momenten jede begrenzte Verteilung eindeutig identifiziert, aber ich bin besonders daran interessiert, die Domäne weiter auf Verteilungen mit endlicher Unterstützung zu beschränken. Alle Referenzen wäre auch dankbar!
Vielen Dank!
quelle
Antworten:
Sei die Verteilung, die auf den Zahlen , die jedem die Wahrscheinlichkeiten Per Definition sein (raw) Moment Grad istF x1<x2<…<xn pi>0 xi. k
Ich werde mit einer Reihe von Beobachtungen über diese Situation beginnen, von denen jede für sich von Interesse ist. Ein grundlegendes Werkzeug ist die Folge von Vektoren für Wenn Sie schreiben jeder Moment als Vektorprodukt ausgedrückt werdenxk=(xk1,xk2,…,xkn) k=0,1,…,n−1. p=(p1,p2,…,pn),
Die Sammlung ist linear unabhängig.{x0,x1,…,xn−1} Um dies zu zeigen, nehmen Sie das Gegenteil an: Das heißt, die Koeffizienten nicht alle Null, so dass Komponente für Komponente ausgeschrieben, behauptet, dass für jedes Das zeigt jedes als Wurzel des PolynomsEin solches Polynom hat höchstens verschiedene Wurzeln, was der Unterscheidbarkeit von widersprichtck ∑k=0n−1ckxk=0.(1) (1) i=1,2,…,n, ∑k=0n−1ckxki=0. xi c(T)=cn−1Tn−1+cn−2Tn−2+⋯+c0. deg(c)≤n−1 n xi.
Alle Momente werden durch die ersten Momenten μ0,μ1,…,μn−1. Das vorstehende Ergebnis zeigt, dass die Vektoren eine Basis für Daher für jedes eine lineare Kombination vondas heißt, es existieren Koeffizienten (bestimmt nur durch ), für die FolglichX={xk,k=0,1,…,n−1}, Rn. m, xm xk, k=0,1,…,n−1; mak xi xm=ma0x0+ma1x1+⋯+man−1xn−1. μm=px′m=p∑i=0n−1makx′k=∑i=0n−1makpx′k=∑i=0n−1makμk.
Die Zahlen und die ersten Momente bestimmenxi n p. In der Tat sind die ersten Momente die Koeffizienten von in der Basis dual zun p X.
Die ersten Momente von bestimmen und werden durch die Verteilung bestimmt, die um eine Konstante verschoben istn F λ. Dies ist die Verteilung, die für mit den Wahrscheinlichkeiten Die Demonstration ist unkompliziert: Verwenden Sie den Binomialsatz, um in Bezug aufx1−λ,x2−λ,…,xn−λ pi. (xi−λ)k x0i,x1i,…,xki.
Ein Teil der Frage ist, ob es einen positiven Wahrscheinlichkeitsvektor und Stützpunkte die eine Verteilung mit dem bestimmen gleiche Momente wie Angenommen, es gibt. Verschieben Sie beide Verteilungen um um die Situation auf Verteilungen mit nicht negativer Unterstützung zu vereinfachen . Wenn Sie beliebig groß nehmen, dominieren schließlich die größten Stützpunkte die Momente: Dies ist nur möglich, wenn undn′, q, y1<y2<…<yn′, G F. λ=−min(x1,y1), m qn′ymn′≈μm≈pnxmn qn′=pn yn′=xn. Wenn wir induktiv fortfahren, schließen wir und das heißt,n=n′, q=p, x1=y1: G=F.
Wie viele Momente müssen schließlich bekannt sein, um und zu bestimmen ? Betrachten Sie die durch definierte ZuordnungSeine Ableitung ist die Matrixp x f:Rn×Rn≈R2n→R2n f(p′,x′)=(px′0,px′1,…,px′2n−1)′. 2n×2n
mit einer Vandermonde-ähnlichen Struktur, die es uns ermöglicht, eine einfache Formel für ihre Determinante zu erhalten,
Da keines der Null ist und alle sind, ist dies ungleich Null. Der Inverse-Funktionssatz impliziert, dass lokal invertierbar ist: Das heißt, wenn im Bereich von , existiert eine Inverse in einer Nachbarschaft von Das ist,pi xi f μ=(μ0,μ1,…,μ2n−1) f f−1⊂Rn×Rn μ.
Wie wir bereits gezeigt haben, entsprechen alle diese Lösungen der gleichen Verteilung: Sie unterscheiden sich nur durch Permutieren der Indizes der Variablen.1,2,…,n
quelle