Unter Mischung von zwei Normalverteilungen:
https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions
"Eine Mischung aus zwei Normalverteilungen hat fünf Parameter zu schätzen: die zwei Mittelwerte, die zwei Varianzen und den Mischungsparameter. Eine Mischung aus zwei Normalverteilungen mit gleichen Standardabweichungen ist nur dann bimodal, wenn sich ihre Mittelwerte um mindestens das Doppelte der gemeinsamen Standardabweichung unterscheiden . "
Ich suche eine Herleitung oder eine intuitive Erklärung, warum dies wahr ist. Ich glaube, es kann in Form eines Zwei-Stichproben-Tests erklärt werden:
Dabei ist die gepoolte Standardabweichung.
Antworten:
Diese Abbildung aus dem in diesem Wiki-Artikel verlinkten Artikel bietet eine schöne Illustration:
Der Beweis, den sie liefern, basiert auf der Tatsache, dass Normalverteilungen innerhalb einer SD ihres Mittelwerts konkav sind (die SD ist der Wendepunkt des normalen PDF, wo sie von konkav zu konvex geht). Wenn Sie also zwei normale PDFs (zu gleichen Anteilen) addieren, ist die Summe-PDF (dh die Mischung) in dem Bereich zwischen den beiden Mitteln und damit konkav, solange sich ihre Mittelwerte um weniger als zwei SDs unterscheiden Das globale Maximum muss genau zwischen den beiden Mitteln liegen.
Referenz: Schilling, MF, Watkins, AE & Watkins, W. (2002). Ist die menschliche Körpergröße bimodal? The American Statistician, 56 (3), 223–229. doi: 10.1198 / 00031300265
quelle
Dies ist ein Fall, in dem Bilder täuschen können, da dieses Ergebnis ein spezielles Merkmal normaler Mischungen ist: Ein Analogon gilt nicht unbedingt für andere Mischungen, selbst wenn die Komponenten symmetrische unimodale Verteilungen sind! Beispielsweise ist eine gleiche Mischung von zwei Student-t-Verteilungen, die durch etwas weniger als das Doppelte ihrer gemeinsamen Standardabweichung getrennt sind, bimodal. Um einen echten Einblick zu erhalten, müssen wir einige Berechnungen anstellen oder spezielle Eigenschaften von Normalverteilungen berücksichtigen.
Wählen Maßeinheiten (durch Rezentrierung und Neuskalierung nach Bedarf) an dem mittels der Teilverteilungen zu platzieren±μ, μ≥0, und ihre gemeinsame Varianz Einheit zu machen. Sei p, 0<p<1, die Menge der Komponente mit dem größeren Mittelwert in der Mischung. Dies ermöglicht es uns, die Gemischdichte in voller Allgemeinheit als auszudrücken
Weil beide Komponentendichten dort zunehmen, wox<−μ und dort abnehmenx>μ, treten die einzig möglichen Moden bei−μ≤x≤μ. Finden Sie sie, indem Sief in Bezug aufx differenzierenund auf Null setzen. Entfernen Sie alle positiven Koeffizienten, die wir erhalten
Durch Ausführen ähnlicher Operationen mit der zweiten Ableitung vonf und Ersetzen von e2xμ durch den durch die vorstehende Gleichung bestimmten Wert wird das Vorzeichen der zweiten Ableitung an jedem kritischen Punkt als Vorzeichen von angegeben
Da der Nenner negativ ist, wenn−μ<x<μ, das Vorzeichen von f′′ das von −(1−μ2+x2). μ≤1, μ 1
Das entspricht logischerweise der Aussage in der Frage.
quelle
Kommentar von oben aus Gründen der Kontinuität hier eingefügt:
"[F] odermal, für eine 50: 50-Mischung von zwei Normalverteilungen mit der gleichen SD σ, wenn Sie die Dichte f ( x ) = 0,5 g 1 ( x ) + schreibenf(x)=0.5g1(x)+0.5g2(x)
Kommentar fortgesetzt:
R-Code für die Figur:
quelle