Ich lese hier gegeben , dass eine Probe aus einer stetigen Verteilung mit cdf folgt die zu korrespondierende Stichprobe einer einheitlichen Standardverteilung.U i = F X ( X i )
Ich habe dies mithilfe von qualitativen Simulationen in Python überprüft und konnte die Beziehung problemlos überprüfen.
import matplotlib.pyplot as plt
import scipy.stats
xs = scipy.stats.norm.rvs(5, 2, 10000)
fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
scipy.stats.norm.cdf(xs, 5, 2),
bins=50
)
axes[1].set_title("CDF(samples)")
Daraus ergibt sich die folgende Handlung:
Ich kann nicht verstehen, warum das passiert. Ich gehe davon aus, dass es mit der Definition des CDF und seiner Beziehung zum PDF zu tun hat, aber mir fehlt etwas ...
Ich würde es begrüßen, wenn jemand mich auf eine Lektüre zum Thema hinweisen oder mir helfen könnte, eine gewisse Intuition zum Thema zu bekommen.
EDIT: Die CDF sieht so aus:
Antworten:
Angenommen, ist stetig und nimmt zu. Definieren Sie Z = F X ( X ) und beachten Sie, dass Z Werte in [ 0 , 1 ] annimmt . Dann ist F Z ( x ) = P ( F X ( X ) ≤ x ) = P ( X ≤ F - 1 X ( x ) ) = F X ( F -FX Z= FX( X) Z [ 0 , 1 ]
Wenn andererseits eine einheitliche Zufallsvariable ist, die Werte in [ 0 , 1 ] annimmt , ist F U ( x ) = ∫ R f U ( u )U [ 0 , 1 ]
quelle
quelle