Warum funktioniert die Kontinuitätskorrektur (etwa die normale Annäherung an die Binomialverteilung)?

24

Ich möchte besser verstehen, wie die Kontinuitätskorrektur zur Binomialverteilung für die normale Approximation abgeleitet wurde.

Welche Methode wurde verwendet, um zu entscheiden, dass wir 1/2 hinzufügen sollten (warum nicht eine andere Zahl?). Jede Erklärung (oder ein Link zu vorgeschlagenen Lesen, anders als diese , würde geschätzt).

Tal Galili
quelle

Antworten:

29
  1. Tatsächlich "funktioniert" dies nicht immer (im Sinne einer ständigen Verbesserung der Approximation der binomischen cdf durch die Normale bei jedem ). Wenn das Binom 0,5 ist, denke ich, hilft es immer, außer vielleicht für den extremsten Schwanz. Wenn nicht zu weit von 0,5 entfernt ist, funktioniert es für einigermaßen großes Allgemeinen sehr gut, außer im fernen Schwanz, aber wenn nahe 0 oder 1 ist, hilft es möglicherweise überhaupt nicht (siehe Punkt 6. unten).p p n pxppnp

  2. Eine Sache, die Sie beachten sollten (trotz der fast immer mit pmfs und pdfs behafteten Abbildungen), ist, dass wir versuchen, uns dem cdf anzunähern. Es kann nützlich sein zu überlegen, was mit dem cdf des Binomials und der approximierenden Normalen los ist (z. B. hier ist ):n=20,p=0.5

    Bildbeschreibung hier eingeben

    In der Grenze wird der cdf eines standardisierten Binomials zu einer Standardnormalen (beachten Sie, dass die Standardisierung die Skala auf der x-Achse, aber nicht die y-Achse beeinflusst); auf dem Weg zu immer größeren die Sprünge der binomischen CDF neigen dazu, gleichmäßiger die normale CDF spreizen.n

    Lassen Sie uns in das obige einfache Beispiel hineinzoomen und es betrachten:

    Bildbeschreibung hier eingeben

    Beachten Sie, dass die ungefähre Normale in der Nähe der Mitte der vertikalen Sprünge verläuft *, während die normale cdf im Grenzfall lokal ungefähr linear ist und (ebenso wie die Progression der binomialen cdf am oberen Rand jedes Sprungs). Infolgedessen neigt das cdf dazu, die horizontalen Stufen in der Nähe von zu überqueren . Wenn Sie den Wert des Binomial-cdf, bei ganzzahligem , approximieren möchten, erreicht das normale cdf diese Höhe in der Nähe von . F(x)xx+1x+12F(x)xx+12

    * Wenn wir Berry-Esseen auf mittelwertkorrigierte Bernoulli-Variablen anwenden, lassen die Berry-Esseen-Grenzen sehr wenig Bewegungsspielraum, wenn in der Nähe von und in der Nähe von - die normale cdf muss in der Nähe der Mitte von einigermaßen passieren die sprünge dorthin, weil sonst der absolute unterschied in den cdfs die beste auf der einen oder anderen seite gebundene beere-essen übersteigt. Dies bezieht sich wiederum darauf, wie weit von die normale cdf den horizontalen Teil der Sprungfunktion der Binomial-cdf überschreiten kann.1p xμx+112xμx+12

  3. Wir gehen auf die Motivation ein, die wir in 1. betrachten, um mit einer normalen Annäherung an das binomische cdf zu berechnen . ZB (siehe das zweite Diagramm oben). Also ist unsere Norm mit dem gleichen Mittelwert und sd . Beachten Sie, dass wir den Sprung in cdf bei 9 durch die Änderung in normalem cdf zwischen ungefähr 8,5 und 9,5 approximieren würden.n = 20 , p = 0,5 , k = 9 N ( 10 , ( P(X=k)n=20,p=0.5,k=9N(10,(5)2)

Bildbeschreibung hier eingeben

  1. Wenn wir das Gleiche unter der weniger formalen, aber "gewöhnlicheren" Lehrbuchmotivation tun (die möglicherweise intuitiver ist, insbesondere für Anfänger), versuchen wir, eine diskrete Variable durch eine kontinuierliche zu approximieren. Wir können eine kontinuierliche Version des Binomials erstellen, indem wir jede Wahrscheinlichkeitsspitze der Höhe durch ein bei zentriertes Rechteck der Breite 1 ersetzen , das die Höhe ergibt (siehe das blaue Rechteck unten; stellen Sie sich für jedes Wert) und dann Annäherung an die normale Dichte mit dem gleichen Mittelwert und sd wie das ursprüngliche Binomial:x p ( x )p(x)xp(x)

    ! [Bildbeschreibung hier eingeben

    Der Bereich unter dem Kästchen wird durch die Normale zwischen und angenähert ; Die beiden fast dreieckigen Teile, die über und unter der horizontalen Stufe liegen, liegen im Bereich eng beieinander. Eine Summe von Binomialwahrscheinlichkeiten in einem Intervall reduziert sich auf eine Sammlung dieser Näherungen. (Ein Diagramm , wie diese Zeichnung ist oft sehr nützlich , wenn es nicht sofort klar , ob Sie brauchen , um 0,5 nach oben oder nach unten für eine bestimmte Berechnung ... Arbeit aus dem binomischen Wert , die Sie in Ihrer Berechnung wollen und gehen auf beiden Seiten durch für Jeder.) x+1x12 1x+1212

    Man kann diesen Ansatz algebraisch motivieren, indem man eine Herleitung verwendet (in Anlehnung an De Moivres - siehe hier oder hier zum Beispiel), um die normale Annäherung abzuleiten (obwohl sie etwas direkter durchgeführt werden kann als der Ansatz von De Moivre).

    Dies geschieht im Wesentlichen über mehrere Approximationen, einschließlich der Verwendung von Stirlings Approximation für den Term und der Verwendung von , um dies zu erhalten(nx)log(1+x)xx2/2

    P(X=x)12πnp(1p)exp((xnp)22np(1p))

    Das heißt, die Dichte einer Normalen mit dem Mittelwert und der Varianz bei ist ungefähr die Höhe des Binomiums pmf bei . Dies ist im Wesentlichen, wo De Moivre bekam.μ=npσ2=np(1p)xx

    Nehmen wir nun an, wir haben eine Näherung der Mittelpunktsregeln für normale Bereiche in Bezug auf Binomialhöhen ... für besagt die Mittelpunktsregel, dass und wir haben von De Moivre, dass . Wenn Sie das ungefähr umdrehen, ist .YN(np,np(1p))F(y+12)F(y12)=y12y+12fY(u)dufY(y)fY(x)P(X=x)P(X=x)F(x+12)F(x12)

    [Eine ähnliche Näherung vom Typ "Mittelpunktregel" kann verwendet werden, um andere solche Näherungen von kontinuierlichen PMFs durch Dichten unter Verwendung einer Kontinuitätskorrektur zu motivieren, aber man muss immer darauf achten, wo es sinnvoll ist, diese Näherung aufzurufen]

  2. Historischer Hinweis: Die Kontinuitätskorrektur scheint bei Augustus de Morgan im Jahr 1838 als Verbesserung der Annäherung von De Moivre entstanden zu sein. Siehe zum Beispiel Hald (2007) [1]. Nach Halds Beschreibung war seine Argumentation in Anlehnung an Punkt 4. oben (dh im Wesentlichen in Bezug auf den Versuch, die PMF durch Ersetzen der Wahrscheinlichkeitsspitze durch einen "Block" der Breite 1 zu approximieren, der auf dem x-Wert zentriert ist).

  3. Ein Beispiel für eine Situation, in der die Kontinuitätskorrektur nicht hilft:

    Bildbeschreibung hier eingeben

    In der Darstellung auf der linken Seite (wobei wie zuvor das Binom ist, die normale Näherung ist), und so . In der Darstellung auf der rechten Seite (dasselbe Binom, aber weiter ) ist und damit - das Es ist besser, die Kontinuitätskorrektur zu ignorieren, als sie in dieser Region zu verwenden.XYp(x)FY(x+1FX(x)FY(x+12)FX(x)FY(x)p(x)FY(x)-FY(x-1)p(x)FY(x+12)FY(x12)FX(x)FY(x)p(x)FY(x)FY(x1)

    [1]: Hald, Anders (2007),
    "Eine Geschichte der parametrischen statistischen Inferenz von Bernoulli bis Fisher, 1713-1935",
    Quellen und Studien zur Geschichte der Mathematik und der Naturwissenschaften,
    Springer-Verlag New York

Glen_b - Setzen Sie Monica wieder ein
quelle
1

Ich glaube, der Faktor ergibt sich aus der Tatsache, dass wir eine kontinuierliche Verteilung mit einer diskreten vergleichen. Wir müssen also übersetzen, was jeder diskrete Wert in der kontinuierlichen Verteilung bedeutet. Wir könnten einen anderen Wert wählen, der jedoch um eine bestimmte Ganzzahl unausgeglichen wäre. (dh Sie würden die Wahrscheinlichkeit, bei 6 zu sein, gegen 7 als 5 abwägen.)

Ich habe hier einen nützlichen Link gefunden: Link

Kitter Catter
quelle