Wie viele Momente definieren eine Distribution mit endlicher Unterstützung eindeutig?

7

Einfache Frage, aber eine, auf die ich anderswo keine genaue Antwort finden konnte. Wie viele Momente einer diskreten Wahrscheinlichkeitsverteilung mit endlicher Unterstützung sind erforderlich, um die genaue Wahrscheinlichkeitsmassenfunktion eindeutig zu identifizieren? Angenommen, wir wissen, dass die Verteilung höchstens Punkte innerhalb eines begrenzten Intervalls unterstützt (für meine Zwecke ist das Intervall ), aber wir kennen die Punkte nicht.N[0,1]

Ist es so, dass die Verteilung durch eine bestimmte Anzahl von Momenten eindeutig identifiziert wird? Meine Hypothese ist, dass es die ersten 2N1 Momente sein können. Da wir N Massenpunkte und ihre N individuellen Wahrscheinlichkeiten identifizieren müssen , könnte man denken, wir brauchen 2N Gleichungen und jeder Moment gibt uns eine Gleichung plus die Einschränkung, dass die Wahrscheinlichkeiten zu 1 summieren . Aber diese Gleichungen sind in den Massenpunkten nicht linear, so dass mir nicht sofort klar ist, dass wir identifiziert sind.

Ich bin mir des Hausdorff-Moment-Problems bewusst , daher weiß ich, dass eine unendliche Folge von Momenten jede begrenzte Verteilung eindeutig identifiziert, aber ich bin besonders daran interessiert, die Domäne weiter auf Verteilungen mit endlicher Unterstützung zu beschränken. Alle Referenzen wäre auch dankbar!

Vielen Dank!

haus_off_space
quelle
Wenn die Punkte des Unterstützungssatzes gleichmäßig verteilt sind, kann ich beweisen, dass Sie nur die ersten Momente kennen müssen. Dies liegt daran, dass die Momenterzeugungsfunktion dann in diesem Fall ein Polynom ten Grades von ist und jedes Polynom vom Grad eindeutig bestimmt wird, wenn Sie die ersten Ableitungen an einem Punkt kennen, was natürlich gerecht ist Was sind die Momente. Ich sehe keinen offensichtlichen Weg, dies für den allgemeineren Fall zu beweisen, in dem die Stützpunkte nicht gleichmäßig verteilt sind. Ich vermute, Sie müssen die unendliche Abfolge von Momenten kennen. N+1Netnn+1
Olooney
Haben Sie im ungleichmäßigen Abstand ein einfaches Beispiel, in dem Sie die Massenpunkte und ihre Gewichte nicht mit Momenten bestimmen können ? Oder eine Intuition dafür, warum man denkt, man würde die volle unendliche Sequenz brauchen? 2N+1
Housed_off_space
Ein Gegenbeispiel wäre sehr schwer zu produzieren; Zumindest wären mindestens drei Unterstützungspunkte erforderlich, nicht alle mit rationalen Verhältnissen. Die Menge kann kein Zählerbeispiel liefern, da dies auch ein Polynom in . Ein Satz wie könnte ein Gegenbeispiel sein. {0,13,1}et/3{0,π4,1}
Olooney
Ich denke, es könnte eine unendliche Sequenz erfordern, weil dies im Allgemeinen der Fall ist. Um eine analytische Funktion eindeutig zu bestimmen (die charakteristische Funktion und mgf einer diskreten Verteilung sind analytisch, weil es sich um die Summe endlich vieler analytischer Funktionen handelt), müssen wir entweder 1) den Wert der Funktion an einer unendlichen Folge von Punkten oder 2 kennen ) alle Ableitungen der Funktion an einem einzelnen Punkt oder 3) der Wert der Funktion in einer offenen Scheibe um einen Punkt. Eine endliche Stichprobe oder die Kenntnis nur endlich vieler Ableitungen reicht nicht aus, um sie eindeutig zu bestimmen.
Olooney
Der Grund, warum wir dafür sorgen können, dass es für Polynome funktioniert, ist, dass sie eine spezielle Struktur haben - insbesondere ist jede Ableitung nach einem bestimmten Punkt Null. Die Struktur der charakteristischen Funktion ist ebenfalls speziell: Sie hat die Form . Aber ist das etwas Besonderes? Könnte sein; Ich weiß nur nicht, wie ich es beweisen soll. k=1Npkexkt
Olooney

Antworten:

4

Sei die Verteilung, die auf den Zahlen , die jedem die Wahrscheinlichkeiten Per Definition sein (raw) Moment Grad istFx1<x2<<xnpi>0xi.k

μk=i=1npixik.

Ich werde mit einer Reihe von Beobachtungen über diese Situation beginnen, von denen jede für sich von Interesse ist. Ein grundlegendes Werkzeug ist die Folge von Vektoren für Wenn Sie schreiben jeder Moment als Vektorprodukt ausgedrückt werdenxk=(x1k,x2k,,xnk)k=0,1,,n1.p=(p1,p2,,pn),

μk=i=1npixik=pxk.

  1. Die Sammlung ist linear unabhängig. {x0,x1,,xn1} Um dies zu zeigen, nehmen Sie das Gegenteil an: Das heißt, die Koeffizienten nicht alle Null, so dass Komponente für Komponente ausgeschrieben, behauptet, dass für jedes Das zeigt jedes als Wurzel des PolynomsEin solches Polynom hat höchstens verschiedene Wurzeln, was der Unterscheidbarkeit von widersprichtck

    (1)k=0n1ckxk=0.
    (1)i=1,2,,n,
    k=0n1ckxik=0.
    xic(T)=cn1Tn1+cn2Tn2++c0.deg(c)n1n xi.

  2. Alle Momente werden durch die ersten Momentenμ0,μ1,,μn1. Das vorstehende Ergebnis zeigt, dass die Vektoren eine Basis für Daher für jedes eine lineare Kombination vondas heißt, es existieren Koeffizienten (bestimmt nur durch ), für die FolglichX={xk,k=0,1,,n1},Rn.m, xmxk, k=0,1,,n1;makxi

    xm=ma0x0+ma1x1++man1xn1.
    μm=pxm=pi=0n1makxk=i=0n1makpxk=i=0n1makμk.

  3. Die Zahlen und die ersten Momente bestimmenxinp. In der Tat sind die ersten Momente die Koeffizienten von in der Basis dual zunpX.

  4. Die ersten Momente von bestimmen und werden durch die Verteilung bestimmt, die um eine Konstante verschoben istnFλ. Dies ist die Verteilung, die für mit den Wahrscheinlichkeiten Die Demonstration ist unkompliziert: Verwenden Sie den Binomialsatz, um in Bezug aufx1λ,x2λ,,xnλpi.(xiλ)kxi0,xi1,,xik.

Ein Teil der Frage ist, ob es einen positiven Wahrscheinlichkeitsvektor und Stützpunkte die eine Verteilung mit dem bestimmen gleiche Momente wie Angenommen, es gibt. Verschieben Sie beide Verteilungen um um die Situation auf Verteilungen mit nicht negativer Unterstützung zu vereinfachen . Wenn Sie beliebig groß nehmen, dominieren schließlich die größten Stützpunkte die Momente: Dies ist nur möglich, wenn undn,q,y1<y2<<yn,GF.λ=min(x1,y1),m

qnynmμmpnxnm
qn=pnyn=xn. Wenn wir induktiv fortfahren, schließen wir und das heißt,n=n, q=p,x1=y1:G=F.

Wie viele Momente müssen schließlich bekannt sein, um und zu bestimmen ? Betrachten Sie die durch definierte ZuordnungSeine Ableitung ist die Matrixpxf:Rn×RnR2nR2n

f(p,x)=(px0,px1,,px2n1).
2n×2n

Df(p,x)=(1100x1xnp1pnx12xn22p1x12pnxnx12n1xn2n1(2n1)p1x12n2(2n1)pnxn2n2)

mit einer Vandermonde-ähnlichen Struktur, die es uns ermöglicht, eine einfache Formel für ihre Determinante zu erhalten,

Det(Df(p,x))=(p1p2pn)2n(1i<jn(xixj))4.

Da keines der Null ist und alle sind, ist dies ungleich Null. Der Inverse-Funktionssatz impliziert, dass lokal invertierbar ist: Das heißt, wenn im Bereich von , existiert eine Inverse in einer Nachbarschaft von Das ist,pixifμ=(μ0,μ1,,μ2n1)ff1Rn×Rnμ.

Die ersten Momente bestimmen einen diskreten Satz von Lösungen , die diesen Momenten entsprechen.2nμ0,μ1,,μ2n1(p,x)

Wie wir bereits gezeigt haben, entsprechen alle diese Lösungen der gleichen Verteilung: Sie unterscheiden sich nur durch Permutieren der Indizes der Variablen.1,2,,n

whuber
quelle
1
Wie gehen wir von lokal invertierbar zu einzigartig? Die Funktion ist in der Nähe von 0 lokal invertierbar, aber das verhindert nicht, dass auch wahr ist, da außerhalb der Nachbarschaft liegt wo funktioniert. Warum könnte es keinen Punkt außerhalb der Nachbarschaft geben, so dass auch gleich ? sin(x)sin(π)=0π(π/2,π/2)sin1(p,x) f(p,x)(μ0,...,μ2n1)
Olooney
1
@olooney Ich habe die Einzigartigkeit zuerst in dem Sinne bewiesen, dass es eine eindeutige Verteilung gibt, die durch die Informationen bestimmt wird: siehe den Absatz, der mit "Teil der Frage" beginnt. Sie haben Recht, dass lokal invertierbar keine eindeutige Funktion das ist der Punkt der letzten Bemerkung. In der Tat gibt esLösungen. f:n!
whuber