ich habe zwei Normalverteilungen A und B mit den Bedeutungen und und den Varianzen und . Ich möchte eine gewichtete Mischung dieser beiden Verteilungen mit den Gewichten und wobei und . Ich weiß, dass der Mittelwert dieser Mischung .
Was wäre die Varianz?
Ein konkretes Beispiel wäre, wenn ich die Parameter für die Verteilung der männlichen und weiblichen Körpergröße kennen würde. Wenn ich einen Raum mit 60% männlichen Personen hätte, könnte ich die erwartete mittlere Körpergröße für den gesamten Raum berechnen, aber was ist mit der Varianz?
normal-distribution
mixture
JoFrhwld
quelle
quelle
Antworten:
Die Varianz ist der zweite Moment minus dem Quadrat des ersten Moments, daher reicht es aus, Momente von Gemischen zu berechnen.
Im Allgemeinen ist bei Verteilungen mit PDFs und konstanten (nicht zufälligen) Gewichten das PDF der Mischungfi pi
woraus folgt, sofort für jeden Augenblick dassk
Ich habe für den Moment von und für den Moment von .μ(k) kth f μ(k)i kth fi
Mit diesen Formeln kann die Varianz geschrieben werden
Wenn die Varianzen von als , dann ist . Ermöglichen, dass die Varianz des Gemisches in Bezug auf die Varianzen und Mittel seiner Komponenten als geschrieben wirdfi σ2i μ(2)i=σ2i+(μ(1)i)2 f
In Worten ist dies die (gewichtete) durchschnittliche Varianz plus dem durchschnittlichen quadratischen Mittel minus dem Quadrat des durchschnittlichen Mittelwerts. Da Quadrieren eine konvexe Funktion ist, geht Jensens Ungleichung davon aus, dass das durchschnittliche quadratische Mittel nicht kleiner sein kann als das Quadrat des durchschnittlichen Mittels. Dies ermöglicht es uns, die Formel so zu verstehen, dass die Varianz der Mischung die Mischung der Varianzen zuzüglich eines nicht negativen Ausdrucks ist, der die (gewichtete) Streuung der Mittelwerte berücksichtigt.
In Ihrem Fall ist die Varianz
Wir können interpretieren, dass dies eine gewichtete Mischung der beiden Varianzen ist, , zuzüglich eines (notwendigerweise positiven) Korrekturterms, um die Verschiebungen von den einzelnen Mitteln relativ zum Gesamtmittelwert der Mischung zu berücksichtigen.pAσ2A+pBσ2B
Die Nützlichkeit dieser Varianz bei der Interpretation von Daten, wie sie in der Frage angegeben ist, ist zweifelhaft, da die Mischungsverteilung nicht normal sein wird (und erheblich davon abweichen kann, sofern sie Bimodalität aufweist).
quelle