Erläutern Sie das Kernel-Dichtediagramm

Ich führe eine Simulation auf einem linearen Modell aus. Ich erhalte 1000 Ergebnisse und die Ergebnisse werden in ein Dichtediagramm eingetragen. Ich verstehe, dass die x-Achse die abhängige Variable ist und die y-Achse die Kerneldichte darstellt. Yaxis ist in Dezimalzahlen von 0 bis 0,15. Wie erkläre ich das den anderen Benutzern? Es besteht eine Wahrscheinlichkeit von 15%, dass die simulierten Werte zwischen x1 und x2 liegen.

Dies ist meine Simulationsausgabe:

summary(s)

Model:  ls 
Number of simulations:  1000 

Values of X
  (Intercept)  Volume
1           1 1699992
attr(,"assign")
[1] 0 1

Expected Values: E(Y|X) 
    mean    sd    50% 2.5%  97.5%
1 12.305 2.638 12.231 7.03 17.512

Geben Sie hier die Bildbeschreibung ein

distributions pdf kernel-smoothing user1471980
quelle

Wie würden Sie die Höhe einer anderen Dichte erklären? (Wenn das der Teil ist, den Sie nicht kennen, scheinen Sie die falsche Frage zu stellen - Sie brauchen die allgemeinere; wenn Sie wissen, wie man eine Dichte erklärt, ist die Erklärung dieselbe)

Glen_b -Reinstate Monica

Antworten:

Sie können sich die Kernel-Dichteschätzung als geglättetes Histogramm vorstellen. Histogramme sind durch die Tatsache begrenzt, dass sie von Natur aus diskret sind (über Bins) und daher besser für die Anzeige von Daten zu diskreten Variablen geeignet sind und sehr empfindlich auf die Bin-Größe reagieren können.

Was Sie tatsächlich mit der Kernel-Dichteschätzung tun, ist die Schätzung der Wahrscheinlichkeitsdichtefunktion. Dies macht die Interpretation einfach. Die Fläche unter der Kurve ist also 1, und die Wahrscheinlichkeit, dass ein Wert zwischen x1 und x2 liegt, ist die Fläche unter der Kurve zwischen diesen beiden Punkten.

Die Anzahl der Y-Werte bestimmt die "Auflösung" der Kurve. Wenn Sie also eine gerade Linie zwischen jeweils zwei benachbarten Y-Punkten annehmen, können Sie eine Annäherung der Fläche unter der Kurve zwischen diesen beiden Punkten berechnen.

So bestimmen Sie die Wahrscheinlichkeit eines Wertes : $x$ $P(x_a<x<x_b)$

$P(x_a<x<x_b)=y_a+..+y_b$

Das Ergebnis ist umso genauer, je mehr Werte Sie haben. $y$

Bitweise
quelle

ok, wenn man sich die obige Tabelle ansieht, was bedeutet 0,10? Ich weiß, was x-Achse sind. Wie kann ich feststellen, dass dies eine gute Schätzung ist?

user1471980

Betrachten Sie das obige Diagramm y-Achse c (0,00, 0,10) und müssen Sie die Wahrscheinlichkeit berechnen, dass die x-Achse zwischen 5 und 20 anfängt, (20-5) * (0,10 + 0,00) /2 = 0,75. Es besteht eine 75% ige Wahrscheinlichkeit, dass die Werte aus der Simulation zwischen 5 und 20 liegen. Ist das richtig?

user1471980

Ich glaube, ich verstehe das. Aber ich muss nur sicherstellen. y-Achse c (0, 0,05, 0,10, 0,15), x-Achse c (5,10,15,20), um die kumulative zu berechnen: (20-5) * (0,0 + 0,05 + 0,1 + 0,15) / 4 = 1,125 (Dieser Wert ist größer als 1, ist das richtig?)

user1471980

@ user1471980 Ich habe meine Antwort aktualisiert. Ich entferne meine Kommentare, um Verwirrung zu vermeiden.

Bitwise

Da kein Ruf, den obigen Beitrag zu kommentieren ...

$P(x_a < x < x_b) = y_a + ... + y_b$ $y_a, y_b$

John Smith
quelle