Interpretation von bedingten Dichtediagrammen

Ich würde gerne wissen, wie man Diagramme mit bedingter Dichte richtig interpretiert. Ich habe zwei unten eingefügt, die ich in R mit erstellt habe cdplot.

Ist zum Beispiel die Wahrscheinlichkeit, dass das Ergebnis gleich 1 ist, wenn Var 1 150 ist, ungefähr 80%?

Diagramm der bedingten Dichte

Der dunkelgraue Bereich ist derjenige, der die bedingte Wahrscheinlichkeit ist, dass Resulter gleich 1 ist, oder?

Diagramm der bedingten Dichte

Aus der cdplotDokumentation:

cdplot berechnet die bedingten Dichten von x unter Berücksichtigung der durch die Randverteilung von y gewichteten y-Werte. Die Dichten werden kumulativ über die Niveaus von y abgeleitet.

Wie wirkt sich diese Akkumulation auf die Interpretation dieser Diagramme aus?

r data-visualization interpretation conditional-probability pdf nofunsally
quelle

Antworten:

Ist zum Beispiel die Wahrscheinlichkeit, dass das Ergebnis gleich 1 ist, wenn Var 1 150 ist, ungefähr 80%?

Nein, es ist umgekehrt. Die Wahrscheinlichkeit, dass Ergebnis wenn Var1 ist, beträgt ungefähr 80%. Ebenso beträgt die Wahrscheinlichkeit, dass Ergebnis wenn Var1 ist, ungefähr 20%. $=0$ $=150$ $=1$ $=150$

Der dunkelgraue Bereich ist die bedingte Wahrscheinlichkeit, dass das Ergebnis gleich 1 ist, oder?

Der dunkel schattierte Bereich entspricht Ergebnis ; Der hell schattierte Bereich entspricht Ergebnis . $=0$ $=1$

Wenn Ihr Ergebnisfaktor mehr als zwei Ebenen enthält, ist es wahrscheinlich offensichtlicher, was dargestellt wird. Wir sind es nur gewohnt, Dichtefunktionen zu betrachten, daher kann diese Darstellung zunächst verwirrend sein.

Wie wirkt sich diese Akkumulation auf die Interpretation dieser Diagramme aus?

Wenn cdplot()ich mir die Quelle anschaue , denke ich, dass hier die geglätteten Anteile der Ergebnisse mit der Dichte der erklärenden Variablen gewichtet werden. Daher werden die Verteilungen der abhängigen Variablen in Regionen mit höherer Dichte der erklärenden Variablen besser dargestellt.

Eine Art der Interpretation besteht darin, dass dort, wo es Bereiche der erklärenden Variablen mit wenigen Punkten gibt, die bedingten Verteilungen nicht so gut bestimmt werden. Wenn es Bereiche der erklärenden Variablen mit mehr Punkten gibt, werden die bedingten Verteilungen besser bestimmt.

jvbraun
quelle