Die Riemann-Stieltjes-Integralschreibweise wird in Erwartungsausdrücken in einigen Wahrscheinlichkeitstexten verwendet. Grundsätzlich erscheint dF (x) im Integral und nicht f (x) dx im Integral, da die CDF F (x) für eine diskrete Verteilung möglicherweise nicht differenzierbar ist.
Die Motivation, die ich dafür gehört habe, besteht normalerweise darin, eine einheitliche Definition der Erwartung zu liefern, anstatt sie mit einem diskreten Fall und einem kontinuierlichen Fall zu behandeln. Es soll auch das Nachdenken über diskrete und kontinuierliche Gemische erleichtern. Aber ich habe noch nie ein Beispiel für die Berechnung einer Erwartung mit einem Riemann-Stieltjes-Integral für eine diskrete Verteilung (oder für eine Verteilung, die eine Mischung aus einer Punktmasse und einer kontinuierlichen Verteilung ist) gesehen.
Kann jemand bitte ein Beispiel für beides oder eines von beiden geben? Vielen Dank!
quelle
Antworten:
Da Sie nicht so klingen, als hätten Sie viel mit dem Integral gemacht, werde ich dies auf sehr elementare (und leicht handgewellte) Weise diskutieren, die etwas von dem vermitteln sollte, was passiert. Sie können jedoch mit einer Erinnerung beginnen, indem Sie sich die Definition eines Stieltjes-Integrals ansehen, siehe beispielsweise Mathworld oder Wikipedia . Um die Integrale richtig zu machen, muss die Grenze in der Definition berücksichtigt werden. In Fällen, in denen dies nicht offensichtlich ist, müssen Sie dies wirklich tun.
Wenn die Verteilung rein diskret ist, ist 0, außer bei den Sprüngen, wo es - für diskrete Fälle ist das Integral also buchstäblich die übliche Summe.dF p(x)
Betrachten Sie als Beispiel einen Bernoulli (0,4).
In diesem Beispiel ist . (Das ist nicht nur "sie haben den gleichen Wert", sondern "diese Dinge sind verschiedene Arten, dasselbe auszudrücken"; ich sollte wahrscheinlich ein passenderes Symbol verwenden.)E(X)=∫∞−∞xdF=∑xxp(x)
Also hier ist überall aber bei (wobei ist ) und (wo es ). Dieser Ausdruck ist also nur .dF 0 x=0 dF 0.6 x=1 0.4 0⋅0.6+1⋅0.4
Die Vereinheitlichung diskreter und kontinuierlicher Formeln ist zwar ordentlich, aber mir fällt der größte Teil ihres Wertes nicht wirklich ein. Ich sehe mehr Wert in der Tatsache, dass dies für Fälle gilt, in denen Sie weder diskrete noch kontinuierliche Zufallsvariablen haben - und es gibt viele Fälle, in denen Sie auf tatsächliche Daten stoßen, sodass es sich nicht um ein esoterisches theoretisches Problem handelt. Wenn Sie eine Notation haben, die reibungslos mit diesen "weder diskreten noch kontinuierlichen" Fällen sowie mit den diskreten und kontinuierlichen Sonderfällen gleichzeitig umgehen kann, gibt es hier einen echten Vorteil.
Nehmen Sie einen schönen einfachen Fall, bei dem es sich beispielsweise nicht um eine Verteilung des täglichen Niederschlags für einen bestimmten Monat und einen bestimmten Ort handelt, die möglicherweise als Mischung aus einer Wahrscheinlichkeit von für Null Regen und nicht logarithmischen Regenmengen ungleich Null modelliert wird (wobei und ) (was als "Null-aufgeblasenes lognormales" Modell bezeichnet werden könnte)0.6 (μ,σ2) μ=1.384 σ=1.823
Dann kann in diesem Fall ein Integral wie das für die Erwartung ziemlich leicht behandelt werden, da es wie die diskrete Definition funktioniert zu und bei diesem Sprung (nur Hinzufügen von beim Sprung, was sich als zum Integral herausstellt , da die gesamte Wahrscheinlichkeit von bei ) und dann in diesem Fall überall über (weil die Funktion ist schön genug, dass Stieltjes dasselbe ist wie gewöhnliches Riemann), der Rest funktioniert wie ein Riemann-Integral von über , solange wir bedenken, dass kleiner ist als es für das lognormale (überE(X)=∫∞−∞xdF x.p(x) 0 0.6 x=0 0 x⋅f(x) 0 dF 0 Sie können sehen, dass relativ zu einem rein lognormalen cdf "zerquetscht" ist, was genau die Wahrscheinlichkeit ( ) berücksichtigt, hier überschreiten .F 0.4 0
Dies funktioniert natürlich gut für mehr als nur ; Ich nehme nur einfache Fälle, um ein wenig zu zeigen, was los ist. (Whuber wies in Kommentaren auf ein schönes Beispiel hin, in dem er eine MGF-Berechnung für ein nicht einfaches Problem durchführt, bei dem die Verteilung als gemischte Verteilung endet.)g(x)=x
Selbst mit diesen sehr schönen Funktionen (wo Sie sie wie Riemann behandeln können, wo sie kontinuierlich sind, was eine Teilmenge der von Stieltjes abgedeckten Fälle ist) gibt es in solchen Mischungen unendlich viele Fälle (und nicht nur "diskret" oder "kontinuierlich"). ), die mit dieser einen Notation behandelt werden können.
Eine nützliche Referenz, die dieses Integral häufig verwendet, um eine Vielzahl von Ergebnissen zu zeigen oder zu diskutieren, ist Advanced Theory of Statistics (Kendall und Stuart - oder in neueren Ausgaben Stuart und Ord). Lassen Sie sich vom Titel nicht erschrecken, es ist ein sehr lesbares Buch.
Wenn Sie also (zum Beispiel) mit Integralen herumspielen, während Sie beispielsweise eine Chebyshev-Ungleichung betrachten, machen Sie nicht nur einen diskreten Fall und einen kontinuierlichen Fall gleichzeitig ... Sie decken jede Verteilung ab, für die das Stieltjes-Integral funktioniert - Wenn Sie sich also fragen, was in Chebyshev passiert, wenn Sie eine Verteilung haben, wie zum Beispiel, dass es eine Niederschlagsmenge gibt, siehe, es wird alles von derselben Entwicklung erledigt. Und wenn Ihr Freund morgen mit einer aufgeblasenen Beta von Null auftaucht, haben Sie das auch schon abgedeckt. Und so weiter ...
[Wenn Sie in eine Situation geraten, in der Sie nicht sofort erkennen können, was das Integral bedeutet, kehren Sie zur Definition zurück und folgen Sie ihr.]
(Dieses schöne Integral kann durch Dinge ersetzt werden, die in der Lage sind, noch umfassendere Situationen zu bewältigen - zu statistischen Zwecken im Allgemeinen für das Lebesgue- oder Lesbesgue-Stieltjes- Integral.)
quelle