Berechnung des Perzentils der Normalverteilung

9

Siehe diese Wikipedia-Seite:

http://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Agresti-Coull_Interval

Um das Agresti-Coull-Intervall zu erhalten, muss ein Perzentil der Normalverteilung berechnet werden, das . Wie berechne ich das Perzentil? Gibt es eine vorgefertigte Funktion, die dies in Wolfram Mathematica und / oder Python / NumPy / SciPy ausführt? $z$

python normal-distribution Ram Rachum
quelle

1

Der integrale Ausdruck im "normalen cdf, den ich genau aus dem Wiki bekommen habe" ist leider um den Faktor

. Es ist keine genaue Formel für das normale cdf oder seine Umkehrung unter Verwendung einer endlichen Anzahl von Begriffen bekannt, die Standardfunktionen (

usw.) verwenden, aber sowohl das normale cdf als auch seine Umkehrung wurden vielfach untersucht, und es gibt ungefähre Formeln für beide programmiert in viele Rechner, Tabellenkalkulationen, ganz zu schweigen von Statistikpaketen. Ich bin nicht mit R vertraut, aber ich wäre erstaunt, wenn es nicht schon das eingebaut hätte, wonach Sie suchen.

1 / \sqrt{π}

$1/\sqrt{\pi}$

\exp, \log, \sin \cos

$\exp, \log, \sin \cos$

Dilip Sarwate

@ DilipSarwate, es ist behoben! Ich mache dies mit inverser Transformation, auch "nicht erlaubt", zu viel eingebaut zu verwenden. Es ist zum Zwecke des Lernens, nehme ich an.

user1061210

1

@ Dilip: Es ist nicht nur keine genaue Formel bekannt, besser noch, es ist bekannt, dass eine solche Formel nicht existieren kann!

Kardinal

1

Die Box-Muller-Methode generiert Stichproben aus einer gemeinsamen Verteilung unabhängiger normaler Standard-Zufallsvariablen. Histogramme der erzeugten Werte ähneln also Standardnormalverteilungen. Die Box-Muller-Methode ist jedoch keine Methode zur Berechnung von Werten von

außer im Übrigen wie in "Ich habe

normale Standardproben erzeugt , von denen

den Wert

oder weniger hat, und somit

und

.

Φ (x)

$\Phi(x)$

10^{4}

$10^4$

8401

$8401$

1

$1$

Φ (1) \approx 0.8401

$\Phi(1) \approx 0.8401$

Φ^{- 1} (0.8401) \approx 1

$\Phi^{-1}(0.8401) \approx 1$

Dilip Sarwate

1

Ich habe gerade

als Beispiel für die Arten von Zahlen gewählt, die Sie erwarten könnten.

und so , wenn Sie erzeugen

Proben einer Standardnormalverteilung, sollten Sie erwarten , nahe zu

der

Proben Wert haben

. Sie implementieren die Box-Muller-Methode korrekt, verstehen aber nicht die Ergebnisse, die Sie erhalten, und beziehen sie nicht auf das PDF usw.

8401

$8401$

Φ (1) = 0.8413 \dots

$\Phi(1) = 0.8413\ldots$

10^{4}

$10^4$

8413

$8413$

10000

$10000$

\leq 1

$\leq 1$

Dilip Sarwate

3

Für Mathematica können $VersionNumber > 5 Sie verwenden

Quantile[NormalDistribution[μ, σ], 100 q]

für das q-te Perzentil.

Andernfalls müssen Sie zuerst das entsprechende Statistikpaket laden.

JM ist kein Statistiker
quelle

(Ich habe Version 7.) Ich habe kein Problem beim Laden des Statistikpakets. Aber wie heißt die Funktion dort? Weil ich den Eindruck habe, dass diese QuantileZeile die Berechnung manuell durchführt, anstatt eine Formel zu verwenden.

Ram Rachum

Auswerten mit symbolischen Parameter (dh nicht Werte zuweisen mu, sigmaund q); Sie sollten einen Ausdruck erhalten, der die inverse Fehlerfunktion beinhaltet.

JM ist kein Statistiker

16

John Cooks Seite " Distributions in Scipy" ist eine gute Referenz für diese Art von Dingen:

In [15]: import scipy.stats

In [16]: scipy.stats.norm.ppf(0.975)
Out[16]: 1.959963984540054

ars
quelle

4

Nun, Sie haben nicht nach R gefragt, aber in R tun Sie es mit? Qnorm

(Es ist eigentlich das Quantil, nicht das Perzentil, oder so glaube ich)

> qnorm(.5)
[1] 0
> qnorm(.95)
[1] 1.644854

Tal Galili
quelle

1

Quantil vs. Perzentil (es ist nur eine Frage der Terminologie), j.mp/dsYz9z .

Chl

1

Während wir in R sind, sind in R Wald-bereinigte CIs (zB Agresti-Coull) im PropCIsPaket enthalten. Wilsons Methode ist die Standardeinstellung in Hmisc::binconf(wie von Agresti und Coull vorgeschlagen).

Chl

2

In Python können Sie das Statistikmodul aus dem scipy- Paket verwenden (suchen Sie nach cdf(), wie im folgenden Beispiel ).

(Es scheint, dass das transzendentale Paket auch übliche kumulative Verteilungen enthält).

chl
quelle

0

Sie können die inverse erf-Funktion verwenden , die beispielsweise in MatLab und Mathematica verfügbar ist.

Für die normale CDF ab

y = Φ (x) = \frac{1}{2} [1 + erf (\frac{x}{\sqrt{2}})]

$y=\Phi\left(x\right)=\frac{1}{2}\left[1+\text{erf}\left(\frac{x}{\sqrt{2}}\right)\right]$

Wir bekommen

x = \sqrt{2} {erf}^{- 1} (2 y - 1)

$x=\sqrt{2}\ \text{erf}^{-1}\left(2y-1\right)$

Für die logarithmisch normale CDF ab

y = F_{x} (x; μ, σ) = \frac{1}{2} erfc (\frac{- \log x - μ}{σ \sqrt{2}})

$y=F_{x}(x;\mu,\sigma)=\frac{1}{2}\text{erfc}\left(\frac{-\log x-\mu}{\sigma\sqrt{2}}\right)$

Wir bekommen

- \log (x) = μ + σ \sqrt{2} {erfc}^{- 1} (2 y)

$-\log \left(x\right)=\mu+\sigma\sqrt{2}\ \text{erfc}^{-1}\left(2y\right)$

Jean-Victor Côté
quelle

2

Ist das nicht eher ein Kommentar als eine Antwort?

Makro

Meine Idee war, dass das Problem gelöst ist, wenn Sie Inversen für die Funktionen erf und erfc haben. MatLab verfügt beispielsweise über solche vorprogrammierten Funktionen.

Jean-Victor Côté

@ Jean-VictorCôté Bitte entwickeln Sie Ihre Ideen in Ihrer Antwort. Ansonsten sieht es lediglich wie ein Kommentar aus, wie oben vorgeschlagen.

Chl

\log (x)

$\log(x)$

x

$x$

Berechnung des Perzentils der Normalverteilung

Antworten: