Ich muss die Verteilung eines bivariaten Gaußschen mit wenigen Stichproben "lernen", aber eine gute Hypothese zur vorherigen Verteilung, also möchte ich den Bayes'schen Ansatz verwenden.
Ich habe meinen Prior definiert:
Und meine Verteilung erhält die Hypothese
Jetzt weiß ich dank hier, dass man den Mittelwert anhand der Daten schätzen kann
Ich kann berechnen:
Nun kommt die Frage, vielleicht liege ich falsch, aber es scheint mir, dass nur die Kovarianzmatrix für den geschätzten Parameter ist und nicht die geschätzte Kovarianz meiner Daten. Was ich gerne hätte wäre auch zu rechnenμ n
um eine vollständige Verteilung aus meinen Daten lernen zu lassen.
Ist das möglich? Wird es bereits durch das Berechnen von gelöst und wird die obige Formel nur falsch ausgedrückt (oder ich interpretiere sie einfach falsch)? Hinweise würden geschätzt. Danke vielmals.
BEARBEITEN
Aus den Kommentaren ging hervor, dass mein Ansatz "falsch" war, in dem Sinne, dass ich eine konstante Kovarianz annahm, definiert durch . Was ich brauche, wäre, auch einen Prior darauf zu setzen, , aber ich weiß nicht, welche Distribution ich verwenden soll und wie ich sie anschließend aktualisiere.P ( Σ )
quelle
Antworten:
Sie können Bayes'sche Aktualisierungen für die Kovarianzstruktur in etwa der gleichen Weise durchführen, wie Sie den Mittelwert aktualisiert haben. Das vorrangige Konjugat für die Kovarianzmatrix der multivariaten Normalen ist die Inverse-Wishart-Verteilung. Es ist also sinnvoll, dort zu beginnen.
Wenn Sie dann Ihr Stichproben- der Länge , können Sie die Stichproben-Kovarianzschätzung berechnen. n ≤ X = 1X n ΣX=1n(X−μ)⊤(X−μ)
Dies kann dann verwendet werden, um Ihre Schätzung der Kovarianzmatrix zu aktualisieren
Sie können den Mittelwert als Punktschätzung für die Kovarianz verwenden (Posterior Mean Estimator).
oder Sie wählen den Modus (Maximum A Posteriori Estimator)
quelle
Ok, ich habe die richtige Lösung für mein Problem gefunden. Ich poste es, auch wenn die richtige Antwort auf meine (verlegte) Frage die ausgewählte ist.
Grundsätzlich erklärt meine Frage, wie man den Mittelwert unter Kenntnis der Kovarianz abschätzt und wie man den Mittelwert unter Kenntnis der Kovarianz abschätzt. Mein eigentliches Problem war jedoch die Schätzung mit beiden unbekannten Parametern.
Ich habe die Antwort auf Wikipedia mit der hier erläuterten Ableitung gefunden . Der konjugierte Prior der multivariaten Normalen ist der Normal-Inverse-Wishart, dh eine Verteilung über multivariate Normalen.
Die vorherigen Parameter, die angegeben werden müssen, sind , um den Mittelwert zu definieren, , um die Kovarianz zu definieren, und zwei Skalarwerte und , die ich sagen würde, definieren, wie sicher wir sind auf die Schätzung der ersten beiden Parameter.Ψ κ 0 ν 0μ0 Ψ κ0 ν0
Die aktualisierte Verteilung nach Beobachtung von Abtastwerten einer Variablen Normal hat die Formpn p
wo
Also meine gewünschten geschätzten Parameter sind
E(Σ|X)=Ψ+C+κ0n
quelle