Ich interessiere mich für folgende einseitige Cantelli-Version der Chebyshev-Ungleichung :
Wenn Sie den Populationsmittelwert und die Varianz kennen, können Sie die Obergrenze für die Wahrscheinlichkeit der Beobachtung eines bestimmten Werts berechnen. (Das habe ich zumindest verstanden.)
Ich möchte jedoch den Stichprobenmittelwert und die Stichprobenvarianz anstelle des tatsächlichen Populationsmittelwerts und der Varianz verwenden.
Ich vermute, dass sich die Obergrenze erhöhen würde, da dies zu mehr Unsicherheit führen würde.
Gibt es eine zu der obigen analoge Ungleichung, die jedoch den Stichprobenmittelwert und die Varianz verwendet?
Edit : Das Analogon "sample" der Chebyshev-Ungleichung (nicht einseitig) wurde ausgearbeitet. Die Wikipedia-Seite enthält einige Details. Ich bin mir jedoch nicht sicher, wie es sich auf den oben genannten einseitigen Fall übertragen lässt.
Antworten:
Ja, wir können anhand des Stichprobenmittelwerts und der Varianz ein analoges Ergebnis erzielen, wobei möglicherweise ein paar leichte Überraschungen dabei auftauchen.
Zunächst müssen wir die Fragestellung ein wenig verfeinern und einige Annahmen machen. Es sollte klar sein, dass wir nicht hoffen können, die Populationsvarianz durch die Stichprobenvarianz auf der rechten Seite zu ersetzen, da letztere zufällig ist ! Wir konzentrieren unsere Aufmerksamkeit also erneut auf die äquivalente Ungleichung Falls es nicht klar ist, dass diese äquivalent sind, beachten Sie, dass wir in der ursprünglichen Ungleichung einfach durch ohne dass die Allgemeinheit darunter leidet.t t σ
Zweitens nehmen wir an, dass wir eine Zufallsstichprobe und dass wir an einer Obergrenze für die analoge Größe interessiert sind , wobei die Stichprobe ist Mittelwert und ist die Standardabweichung der Stichprobe.P ( X 1 - ≤ X ≥ t S ) ≤ X SX1,…,Xn P(X1−X¯≥tS) X¯ S
Einen halben Schritt vorwärts
Beachten Sie, dass wir bereits durch Anwenden der ursprünglichen einseitigen Chebyshev-Ungleichung auf das wobei , was kleiner als die rechte Seite der Originalversion ist. Das macht Sinn! Jede bestimmte Erkenntnis einer Zufallsvariablen aus einer Stichprobe liegt in der Regel (geringfügig) näher am Stichprobenmittelwert, zu dem sie beiträgt, als am Populationsmittelwert. Wie wir weiter unten sehen werden, werden wir unter noch allgemeineren Annahmen durch ersetzen . P ( X 1 - ˉ X ≥ t σ ) ≤ 1X1−X¯ σ2=VeinR(X1)σS
Eine Beispielversion von einseitigem Chebyshev
Hinweis : Wir gehen nicht davon aus, dass die entweder einen endlichen Mittelwert oder eine Varianz haben!Xich
Beweis . Die Idee ist, den Beweis der ursprünglichen einseitigen Chebyshev-Ungleichung anzupassen und dabei Symmetrie anzuwenden. Setzen Sie zunächst um die Schreibweise zu . Dann beobachte, dass P ( Y 1 ≥ t S ) = 1Y.ich= Xich- X¯
Nun, für jedes , auf , { S > 0 } 1 ( Y i ≥ t S ) = 1 ( Y i + t c S ≥ T S ( 1 + c ) ) ≤ 1 ( ( Y i + t c S ) 2 ≥ t 2 ( 1 + c ) 2 S 2 ) ≤ ( Yc > 0 { S> 0 }
Dann ist da und .ˉ Y = 0 ∑ i Y 2 i = ( n - 1 ) S 2
Die rechte Seite ist eine Konstante ( ! ), So dass sich unter Berücksichtigung der Erwartungen auf beiden Seiten ergibt: Schließlich ergibt die Minimierung über , was nach einer kleinen Algebra das Ergebnis festlegt.
Dieser lästige technische Zustand
Beachten Sie, dass wir annehmen mussten, um in der Analyse durch dividieren zu können . Für absolut kontinuierliche Verteilungen ist dies kein Problem, für diskrete Verteilungen jedoch ein Nachteil. Für eine diskrete Verteilung besteht eine gewisse Wahrscheinlichkeit, dass alle Beobachtungen gleich sind. In diesem Fall ist für alle und .P (S= 0 ) = 0 S2 0 = Yich= t S= 0 ich t > 0
Wir können uns herauswinden, indem wir . Dann zeigt eine sorgfältige Abwägung des Arguments, dass alles praktisch unverändert durchläuft und wir bekommenq= P ( S= 0 )
Beweis . Teilen Sie die Ereignisse und . Der vorherige Beweis geht für und der Fall ist trivial.{ S> 0 } { S= 0 } { S> 0 } { S= 0 }
Eine etwas sauberere Ungleichung ergibt sich, wenn wir die nicht strenge Ungleichung in der Wahrscheinlichkeitsangabe durch eine strenge Version ersetzen.
Schlussbemerkung : Die Probe - Version der Ungleichheit benötigte keine Annahmen über (außer , dass es nicht fast sicher sein , konstant in dem nicht strikter Ungleichheit Fall, der die Originalversion auch davon ausgegangen , stillschweigend) im Wesentlichen vor , weil die Probe Mittelwert und Probenvarianz existieren immer, unabhängig davon, ob es ihre Populationsanaloga tun oder nicht.X
quelle
Dies ist nur eine Ergänzung zu @ cardinals genialer Antwort. Samuelson-Ungleichung besagt, dass für eine Stichprobe der Größe , wenn wir mindestens drei verschiedene Werte der realisierten , gilt: wobei ohne die Vorspannungskorrektur berechnet wird, .n xich
Dann können wir unter Verwendung der Schreibweise von Kardinals Antwort feststellen, dass
Da wir drei verschiedene Werte benötigen, haben wir nach Annahme . Setzen Sie also in Kardinals Ungleichung (die ursprüngliche Version), die wir erhaltenS≠ 0 t = n - 1-----√
Gl. ist natürlich kompatibel mit Gl. . Aus der Kombination der beiden geht hervor, dass die Kardinal-Ungleichung als probabilistische Aussage für nützlich ist .[ 2 ] [ 1 ] 0 < t < n - 1-----√
Wenn die Kardinal-Ungleichung erfordert, dass vorspannungskorrigiert berechnet wird (nennen Sie diese ), werden die GleichungenS S~
und wir wählen , um durch Kardinals Ungleichung zu erhaltent = n - 1n√
quelle