Ich führe eine Simulation auf einem linearen Modell aus. Ich erhalte 1000 Ergebnisse und die Ergebnisse werden in ein Dichtediagramm eingetragen. Ich verstehe, dass die x-Achse die abhängige Variable ist und die y-Achse die Kerneldichte darstellt. Yaxis ist in Dezimalzahlen von 0 bis 0,15. Wie erkläre ich das den anderen Benutzern? Es besteht eine Wahrscheinlichkeit von 15%, dass die simulierten Werte zwischen x1 und x2 liegen.
Dies ist meine Simulationsausgabe:
summary(s)
Model: ls
Number of simulations: 1000
Values of X
(Intercept) Volume
1 1 1699992
attr(,"assign")
[1] 0 1
Expected Values: E(Y|X)
mean sd 50% 2.5% 97.5%
1 12.305 2.638 12.231 7.03 17.512
distributions
pdf
kernel-smoothing
user1471980
quelle
quelle
Antworten:
Sie können sich die Kernel-Dichteschätzung als geglättetes Histogramm vorstellen. Histogramme sind durch die Tatsache begrenzt, dass sie von Natur aus diskret sind (über Bins) und daher besser für die Anzeige von Daten zu diskreten Variablen geeignet sind und sehr empfindlich auf die Bin-Größe reagieren können.
Was Sie tatsächlich mit der Kernel-Dichteschätzung tun, ist die Schätzung der Wahrscheinlichkeitsdichtefunktion. Dies macht die Interpretation einfach. Die Fläche unter der Kurve ist also 1, und die Wahrscheinlichkeit, dass ein Wert zwischen x1 und x2 liegt, ist die Fläche unter der Kurve zwischen diesen beiden Punkten.
Die Anzahl der Y-Werte bestimmt die "Auflösung" der Kurve. Wenn Sie also eine gerade Linie zwischen jeweils zwei benachbarten Y-Punkten annehmen, können Sie eine Annäherung der Fläche unter der Kurve zwischen diesen beiden Punkten berechnen.
So bestimmen Sie die Wahrscheinlichkeit eines Wertes :x P.( xein< x < xb)
Das Ergebnis ist umso genauer, je mehr Werte Sie haben.y
quelle
Da kein Ruf, den obigen Beitrag zu kommentieren ...
quelle