Bei einer Beta-Verteilung mit a = 2, b = 3 können wir einen erwarteten Wert (Mittelwert) für das Intervall [0, 1] = a / (a + b) = 2/5 = 0,4 und den Median = (a - finden) 1/3) / (a + b-2/3) = 0,39, die nahe beieinander liegen.
Ich suche nach einer Lösung in Python. Ich kann scipy.stats.beta verwenden , um den Median für das Intervall [0, 0,4] mit der Prozentpunktfunktion (invers zu cdf - Perzentilen) zu berechnen:
beta.ppf(0.4/2,a,b) = 0.2504
Da für diese Beta-Verteilung der Gesamtmittelwert und der Median nahe beieinander liegen (0,4 bzw. 0,39), verwende ich den Median für das Intervall [0, 0,4], um die erwarteten Werte (Mittelwert) für das Intervall [0, 0,4] zu schätzen.
Gibt es eine Möglichkeit, erwartete Werte (Mittelwert) für das Intervall [0, 0,4] zu berechnen?
python
mean
median
beta-distribution
truncation
Arbi Haza Nasution
quelle
quelle
Antworten:
Beachten Sie, dass die Formel, die Sie dort oben für den Beta-Median haben ( ), ungefähr ist. Sie sollten in der Lage sein, einen effektiv "exakten" numerischen Median mit dem inversen cdf (Quantilfunktion) der Beta-Verteilung in Python zu berechnen (für ein erhalte ich einen Median von ungefähr während dieser ungefähr ist Formel ergibt ).α−13α+β−23 beta(2,3) 0.3857 0.3846
Dieser Mittelwert einer abgeschnittenen Distribution ist mit einer Beta ziemlich einfach. Für eine positive Zufallsvariable haben wir
wobei in diesem Fall die Dichte einer Beta mit den Parametern und (die ich jetzt als schreibe ):f α β f(x;α,β)
Daher istxf(x)=B(α+1,β)B(α,β)f(x;α+1,β)=αα+βf(x;α+1,β)
Also istE(X|X<k)=αα+β∫k0f(x;α+1,β)dx/∫k0f(x;α,β)dx
Jetzt sind die beiden Integrale nur noch Beta-CDFs, die Sie bereits in Python verfügbar haben.
Mit wir . Dies steht im Einklang mit der Simulation ( Simulationen ergaben ).α=2,β=3,k=0.4 E(X|X<0.4)≈0.24195 106 ≈0.24194
Für den Median erhalte ich , was wiederum mit der Simulation übereinstimmt ( Simulationen ergaben ).F−1(12F(0.4;2,3);2,3)≈0.25040 106 ≈0.25038
Die beiden sind sich in diesem Fall ziemlich nahe, aber das ist kein allgemeines Ergebnis. Sie können manchmal wesentlich unterschiedlicher sein.
quelle