Überquert die Erwartung der ausreichenden Statistik den gesamten Raum in einer exponentiellen Familie?

7

Eine Exponentialfamilie wird unter Verwendung von zwei Bestandteilen definiert: - eine Basisdichte - eine Anzahl ausreichender Statistikenq0(x)Si(x)

Die Familie besteht aus allen Wahrscheinlichkeitsdichten, die geschrieben werden können als:

q(x|(λ)i)q0(x)exp(iλiSi(x))

Es ist bekannt, dass die Beziehung zwischen den Parametern und dem erwarteten Wert der ausreichenden Statistik: ist eine Bijektion.(λi)

Eq(Si(x)|(λi))=Si(x)q0(x)exp(iλiSi(x))dxq0(x)exp(iλiSi(x))dx

Meine Frage ist, ob diese Bijektion weiterhin "alle möglichen Werte" für . In meiner ursprünglichen Frage habe ich dieses Ensemble "aller möglichen Werte" sehr schlecht definiert, so dass die Antwort auf meine Frage etwas trivial Nein war.Eq(Si(x)|(λi))

Um "alle möglichen Werte" zu definieren, müssen wir das Bild der vektorwertigen Funktion betrachten:

xS(x)

Ein Wert in kann durch den erwarteten Wert von unter einer Wahrscheinlichkeitsdichte wenn und nur wenn er sich innerhalb der konvexen Hülle des Bildes von .RdSp(x)S

Die Frage ist dann: Wann hat der erwartete Wert von innerhalb der Exponentialfamilie auch die Eigenschaft, die gesamte konvexe Hülle des Bildes von überspannen ?SS

Hier sind zwei Beispiele:

Die Gaußsche Familie in n-Dimensionen: Die ausreichenden Statistiken sind alle ersten und zweiten Momente. Es ist in der Tat so, dass alle ersten und zweiten Momente von einem Gaußschen erreicht werden können.

Die Exponentialfamilie:

q(x|λ)=exp(|x|+λx2)

erreicht nicht alle Werte für den zweiten Moment: Werte über der Obergrenze bei werden nicht erreicht.λ=0

Dieses zweite Beispiel lässt mich denken, dass Probleme in den Schwänzen auftreten werden, wenn sie überhaupt auftreten, aber vielleicht ist die Intuition falsch.

Guillaume Dehaene
quelle

Antworten:

4

Kurze Antwort auf OP

Nicht unbedingt, es hängt davon ab, ob der erweiterte konvexe Kegel, der durch Variieren von außerhalb des Bereichs Ihres Parameterraums überspannt wird, den gesamten mittleren Parameterraum abdecken kann. Eine Situation ist, dass Ihr Exponentialmodell überparametrisiert ist, wobei Sie nicht den gesamten Raum durch Variieren von 's "füllen" können ; Die andere Situation ist, dass Ihre exponentielle Familie gekrümmt ist, was auch bei einem solchen Versuch fehlschlägt. Siehe auch meine Antwort HIERλiλ

Ich möchte diese Antwort nicht wirklich in eine Darstellung des mittleren Parameterraums verwandeln (vielleicht [Brown], aber bei weitem nicht vollständig), aber es scheint jetzt nach aufeinanderfolgenden Diskussionen unvermeidlich. Ich weiß nicht wirklich, ob es irgendwelche Abhandlungen gibt, die dem mittleren Parameterraum gewidmet sind, aber der mittlere Parameterraum gibt eine natürliche Darstellung der Familie der Wahrscheinlichkeitsmaße und ist daher für die konvexe Analyse geeignet. In den meisten statistischen Anwendungen ist die Differenzierbarkeit für die Realität viel zu stark.

Differenzierbarkeit Parameter WRT in der Regel nur dann ausgegangen , eine Art von Konsistenz guarante , wenn andere Annahmen entweder trivial oder zu kompliziert zu formalisieren. ZB Bootstrap-Methoden .

Continuity wrt-Parameter sind eine recht milde Annahme, und wir möchten sie manchmal annehmen, selbst wenn die gesammelten Daten diskret zu sein scheinen. Kontinuität ermöglicht eine Art lokale Inferenz, aber einige Optimierungstechniken haben ihre Leistung verloren. ZB Schnellste Gradientenmethode.

bull Convexity wrt-Parameter sind die schwächste Annahme unter drei, aber trotzdem wollen wir das nicht immer annehmen. ZB konkave Verlustfunktion.

Der mittlere Parameterraum wird eingeführt, um der "konvexen Familie" eine nützliche Darstellung zu geben. Später in der Untersuchung der Positivität [Karlin] wird die Dualität zwischen dem mittleren Parameterraum und der Familie der PMS als sehr nützlich befunden. Es gibt andere Motivationen wie die Frenchel-Dualität aus der konvexen Analyse, die erklären, warum wir den mittleren Parameterraum untersuchen. Sie können jedoch sehen, dass normalerweise eine Art von Subgradienten eingeführt wird, um den konvexen Raum nach dem Hilbert-Raum zu modellieren.

Nun erklären wir, warum der mittlere Parameterraum wichtig ist. Definieren Sie den Doppelkegel für einen konvexen Kegel Für einen speziellen Fall sagte uns der Karlin-Shapley-Repräsentationssatz [Karlin & Shapley], dass die extremen Strahlen / Punkte des Doppelkegels des Momentraums, der mit der Familie verbunden ist, genau an der Grenze von liegen der Parameterraum.CRn+1 C+:={vRn+1:<v,u>≥0,uC}

Denn was kann eine ausreichende Familie Art von Werten erreichen, wenn die ausreichenden Statistiken ist ebenfalls vollständig und haben die gleiche Dimension wie der Parameterraum, die die Struktur der exponentiellen Familie bedeuten , linear, dann glaube ich , solange die Der Parameterraum hat keine entartete Grenze, die Erwartung einer ausreichenden Statistik kann alle Werte überschreiten . Aus geometrischer Sicht können Sie nur dann, wenn der Doppelkegel entartet ist, den gesamten Raum durchqueren und alle "möglichen Werte" erreichen, die möglicherweise hat.S(X)ES(X)ES(X)

Wenn es nicht vollständig oder überparametriert oder gekrümmt ist, bin ich mir nicht sicher.

In Ihrem zweiten Beispiel ist der doppelte Kegel des Momentraums tatsächlich ein strenger Kegel, während im ersten Beispiel ein entarteter Kegel (der gesamte , stellen Sie sich vor, dass der Durchmesser eines Kegels dazu neigt ). Aber ich bin mir immer noch nicht sicher, wie Sie das von Ihnen behauptete Ergebnis erreichen.R×R

Referenz

[Brown] Brown, Lawrence D. "Grundlagen statistischer Exponentialfamilien mit Anwendungen in der statistischen Entscheidungstheorie." Lecture Notes-Monographienreihe 9 (1986): i-279.

[Karlin] Karlin, Samuel. Totale Positivität. Vol. 1. Stanford University Press, 1968.

[Karlin & Shapley] Karlin, Samuel und Lloyd S. Shapley. Geometrie von Momentenräumen. Nr. 12. American Mathematical Soc., 1953.

Henry.L
quelle
1
Ah. Ich hatte das Problem mit gekrümmten exponentiellen Familien nie verstanden. Ich verstehe, warum das Eigentum nicht für sie halten würde. Würde die Immobilie, die ich suche, nicht für nicht gekrümmte exponentielle Familien mit vollem Rang gelten?
Guillaume Dehaene
1
Ich denke, eine überparametrisierte Familie könnte auch Ihren Anspruch verfehlen. Ich kenne keine ausreichende notwendige Bedingung, damit der natürliche Parameterraum mit dem mittleren Parameterraum übereinstimmt, aber eine mögliche Referenz ist Brown, Lawrence D. "Grundlagen statistischer Exponentialfamilien mit Anwendungen in der statistischen Entscheidungstheorie." Lecture Notes-Monographienreihe 9 (1986): i-279.
Henry.L
1
@GuillaumeDehaene Und ich möchte sicherstellen, dass Sie "wenn der mittlere Parameterraum mit dem natürlichen Parameterraum übereinstimmt ", richtig? (Siehe meinen MO-Beitrag)MλΛ
Henry.L
1
Eine überparametrisierte Familie scheitert ebenfalls an der Behauptung, ja. Wenn beispielsweise , überspannt das Momentpaar nicht den Bereich möglicher Werte, sondern nur die "Diagonale". S1=S2
Guillaume Dehaene
Ich glaube nicht, dass ich das will, obwohl ich nicht sicher bin, was du meinst, wenn du sagst, dass sie "zusammenfallen".
Guillaume Dehaene