Wie wird die Höhe des Dichtediagramms interpretiert?

12

Wie soll ich die Höhe von Dichtediagrammen interpretieren:

Bildbeschreibung hier eingeben

Beispielsweise liegt in der obigen Auftragung der Peak bei etwa 0,07 bei x = 18. Kann ich daraus schließen, dass etwa 7% der Werte bei 18 liegen? Kann ich genauer sein? Es gibt auch einen zweiten Peak bei x = 30 mit einer Höhe von 0,02. Bedeutet das, dass etwa 2% der Werte bei 30 liegen?

Bearbeiten: Die Frage nach Kann ein Wahrscheinlichkeitsverteilungswert größer als 1 OK sein?diskutiert den Wahrscheinlichkeitswert von> 1, der hier überhaupt kein Thema ist. Es wird auch besprochen, dass in Bezug auf naive Bayes classfier, die auch hier nicht der Punkt ist. Ich möchte in einfacher Sprache die numerischen Schlussfolgerungen haben, die wir aus solchen Dichtekurven ziehen können. Die Rolle der Fläche unter der Kurve wird diskutiert, aber meine Frage ist speziell, welchen Rückschluss wir auf eine bestimmte x- und y-Kombination ziehen können, die auf der Kurve existiert. Wie können wir zum Beispiel x = 30 und y = 0,02 in diesem Diagramm in Beziehung setzen? Welche Aussage können wir über die Beziehung zwischen 30 und 0,02 hier schreiben? Können wir sagen, dass 2% der Werte zwischen 29,5 und 30,5 liegen, da sich die Dichten auf einen Einheitswert beziehen? Wenn dies der Fall ist, wie interpretieren wir, wenn die Werte nur von 0 bis 1 variieren, wie im folgenden Diagramm dargestellt:

Bildbeschreibung hier eingeben

Wenn 100% der Werte zwischen 0 und 1 liegen, warum liegt eine Kurve außerhalb von 0 und 1?

Hier gibt es einen flachen Teil bei x = 0,1 bis x = 0,2, wobei y gleich 0,8 ist. Es bildet ein Rechteck. Wie können wir herausfinden, welcher Werteanteil zwischen x = 0.1 und x = 0.2 auftritt?

(PS: Wenn Sie diese Frage interessant / wichtig finden, stimmen Sie sie bitte hoch;)

rnso
quelle
4
Der erste als Duplikat erwähnte Thread ist trotz des genauen Wortlauts im Titel relevant, da er darauf hinweist, dass eine Wahrscheinlichkeitsdichte, wie für stetige Variablen berechnet, keine Wahrscheinlichkeit ist. (Eine subtilere Version würde die Dichte rigoros definieren und die Möglichkeit einschließen, dass die Dichte durch Zählen des Maßes definiert wird.)
Nick Cox,
Ich bin mit @NickCox einverstanden, aber mit den zusätzlichen Bearbeitungen gibt es in Tims sehr guter Liste eng verwandter Fragen mehr Fokus auf den Bereich (der wie die dritte Frage ist) als auf die Höhe (die eher wie die zweite Frage ist).
Silberfischchen
3
Es gibt auch ein separates Problem, das in diesen Fragen nicht angesprochen wird, weshalb ich nicht denke, dass dies insgesamt ein Duplikat jeder dieser Fragen ist: Warum kann es im empirischen Diagramm im Gegensatz zu theoretischen Dichtediagrammen "Dichte" außerhalb geben? die Unterstützung (oder beobachtete Werte) der Distribution? Dies erfordert zusätzliche Diskussionen über die Bandbreite und die Konstruktion und Interpretation von Kernel-Dichte-Plots. Vielleicht würde diese Frage von einer Bearbeitung profitieren und sich auf die Themen konzentrieren, bei denen vorhandene Fragen nicht dupliziert werden.
Silberfischchen

Antworten:

6

Sie müssen hier mit Ihrer Formulierung vorsichtig sein. Unter der Annahme, dass x eine stetige Variable ist, ist die Wahrscheinlichkeit für einen einzelnen Wert genau null. Reden, wie Sie die Wahrscheinlichkeit , einen Wert haben, über liegend um irgendwann ist in Ordnung, wenn man ein bisschen genauer sein möge. Nach Ihrer zweiten Aussage, in der Sie das Intervall zusammen mit der Wahrscheinlichkeit angegeben haben, würde ich suchen.

Im Wesentlichen gibt ein Integral der Dichtefunktion in Bezug auf x Auskunft über die Wahrscheinlichkeit selbst (daher heißt es Dichte ). Offensichtlich kann das Intervall, über das Sie integrieren, beliebig klein sein, sodass Sie sich einem Punkt in einem beliebigen Ausmaß nähern können. Wenn sich die Dichtefunktion jedoch über dieses Intervall sehr langsam ändert, können Sie das Integral durch eine numerische Technik, wie die Trapezregel, approximieren .

Zusammenfassend: Die Höhe der Dichtefunktion ist genau das, ihre Höhe. Alles, was Sie über die Wahrscheinlichkeit abschließen möchten, muss die Integration der einen oder anderen Form beinhalten.

Fato39
quelle
summiert sich die Fläche unter der Kurve in diesem Diagramm immer auf 1,0?
ecologist1234
1
-