Was ist der beste Weg, um eine Beziehung zwischen:
- kontinuierliche und diskrete Variable,
- zwei diskrete Variablen?
Bisher habe ich Streudiagramme verwendet, um die Beziehung zwischen kontinuierlichen Variablen zu untersuchen. Bei diskreten Variablen werden die Datenpunkte jedoch in bestimmten Intervallen kumuliert. Somit könnte die Linie der besten Anpassung vorgespannt sein.
Antworten:
Unten: Die ursprüngliche Darstellung kann irreführend sein, da sich die Punkte aufgrund der Diskretion der Variablen überlappen:
Eine Möglichkeit, dies zu umgehen, besteht darin, das Datensymbol etwas transparenter zu gestalten:
Eine andere Möglichkeit besteht darin, die Position des Symbols leicht zu verschieben, um einen Abstrich zu erstellen. Diese Technik wird "Jittering" genannt:
Mit beiden Lösungen können Sie weiterhin eine gerade Linie zur Bewertung der Linearität einpassen.
R-Code für Ihre Referenz:
quelle
Ich würde Boxplots verwenden, um die Beziehung zwischen einer diskreten und einer kontinuierlichen Variablen anzuzeigen. Sie können Ihre Boxplots mit Standard-Statistiksoftware vertikal oder horizontal erstellen, sodass Sie sie einfach als IV oder DV visualisieren können. Es ist möglich , ein Streudiagramm mit einer diskreten und kontinuierlichen Variablen zu verwenden, nur eine Zahl auf die diskreten Variablen zuweisen ( zum Beispiel 1 & 2), und Jitter dieser Werte (Anmerkung oben Grundstück direkt am hier ).
In Bezug auf Ihren Kommentar, dass die Linie der besten Anpassung voreingenommen sein könnte, hängt es davon ab, was Sie haben. Wenn Sie zum Beispiel eine diskrete Variable mit zwei Stufen als IV und eine kontinuierliche Variable als DV haben, können Sie eine Linie durch die beiden Mittel ziehen, und dies wird nicht verzerrt. (Wir würden diese Situation normalerweise als angemessen für einen t-Test ansehen, aber es ist tatsächlich eine Form - dh ein einfacher Fall - der Regression, siehe meine Antwort hier .) Wenn Sie dagegen eine diskrete haben Variable mit zwei Stufen als DV, Standard-Regression (OLS) wäre ungeeignet (logistische Regression wäre erforderlich ) und die Linie der besten Anpassung wäre voreingenommen, aber Sie könnten eine Geringfügigkeitslinie als Teil Ihrer Initiale anpassen (& plotten) Datenexploration.
Um die Beziehung zwischen zwei diskreten Variablen zu visualisieren, würde ich ein Mosaikdiagramm verwenden . Sie können auch ein Siebdiagramm , ein Zuordnungsdiagramm oder ein dynamisches Druckdiagramm mit etwas Programmierung verwenden.
quelle
Wenn ich die Beziehung zwischen einer binären Ergebnisvariablen und einem stetigen Prädiktor betrachte, würde ich den Lößglätter verwenden (mit deaktivierter Ausreißererkennung, z
lowess(x, y, iter=0)
. B. in R.In der nächsten Version des R-
Hmisc
Pakets können Sie auf einfache Weise eine einzelnelattice
Grafik erstellen , die solche Kurven für mehrere Prädiktoren, zquelle
Wenn Sie mit einfachen Streudiagrammen nicht zufrieden sind, können Sie die Häufigkeiten der Datenpunkte zu jedem Wert der diskreten Variablen hinzufügen. Wie das geht, hängt nur vom verwendeten Statistikprogramm ab. Hier ist ein Beispiel für Stata. Sie können dies auch auf das Streudiagramm von zwei kategorialen Variablen anwenden. Andernfalls sind Boxplots oder überlagerte Balkendiagramme möglicherweise in Ordnung, dies hängt jedoch davon ab, wie Sie diese Variablen darstellen möchten.
quelle
Auf http://www.boekboek.com/xb130929113026 habe ich eine Arbeit gefunden, die sich auf die Assoziation zwischen zwei binären Variablen bezieht. In diesem Artikel wird gezeigt und bewiesen, dass die Assoziationsstärke zwischen zwei binären Variablen als Bruchteil von ausgedrückt werden kann perfekte Assoziation. So wird es möglich und vorzuziehen, anzugeben: Die Assoziation zwischen Variable A und Variable B beträgt beispielsweise 50% anstelle der zeitweiligen Angabe: OR = 9 (nicht leicht zu interpretieren) oder des realen Risikos = 2 (zeitweilig wird das relative Risiko berücksichtigt) auch um ein Maß für Assoziation zu sein, obwohl es tatsächlich eine Funktion von Assoziation, Prävalenz oder Inzidenz und Positivität ist).
quelle