Ich schreibe gerade eine Arbeit mit mehreren multiplen Regressionsanalysen. Während die Visualisierung der univariaten linearen Regression über Streudiagramme einfach ist, habe ich mich gefragt, ob es eine gute Möglichkeit gibt, mehrere lineare Regressionen zu visualisieren.
Ich zeichne gerade Streudiagramme wie abhängige Variable gegen 1. unabhängige Variable, dann gegen 2. unabhängige Variable, usw. Ich würde wirklich alle Vorschläge schätzen.
regression
data-visualization
multiple-regression
Shawn Wang
quelle
quelle
effects
Paket inR
Antworten:
An Ihrer aktuellen Strategie ist nichts auszusetzen. Wenn Sie ein Mehrfach-Regressionsmodell mit nur zwei erklärenden Variablen haben, können Sie versuchen, ein 3D-Diagramm zu erstellen, in dem die vorhergesagte Regressionsebene angezeigt wird. Die meisten Programme machen dies jedoch nicht einfach. Eine andere Möglichkeit ist die Verwendung eines Coplots (siehe auch: Coplot in R oder dieses PDF ), das drei oder sogar vier Variablen darstellen kann, aber viele Leute wissen nicht, wie sie zu lesen sind. Wenn Sie jedoch keine Wechselwirkungen haben, entspricht die vorhergesagte marginale Beziehung zwischen und im Wesentlichen der vorausgesagten bedingten Beziehungxj y Beziehung (plus oder minus einer vertikalen Verschiebung) auf einer bestimmten Ebene Ihrer anderen Variablen. Sie können also einfach alle anderen Variablen auf ihre und die vorhergesagte Linie finden und diese Linie zeichnen auf einem Streudiagramm von Paaren. Darüber hinaus erhalten Sie solche Diagramme, obwohl Sie möglicherweise einige davon nicht einschließen, wenn Sie der Meinung sind, dass sie nicht wichtig sind. (Beispielsweise ist es üblich, ein multiples Regressionsmodell mit einer einzelnen interessierenden Variablen und einigen Steuervariablen zu haben und nur die erste derartige Darstellung zu präsentieren.) x x y^=β^0+⋯+β^jxj+⋯+β^px¯p (xj,y) p
Wenn Sie jedoch Interaktionen haben, sollten Sie herausfinden, an welcher der interagierenden Variablen Sie am meisten interessiert sind, und die vorhergesagte Beziehung zwischen dieser Variablen und der Antwortvariablen aufzeichnen, jedoch mit mehreren Linien in derselben Darstellung. Die andere interagierende Variable wird für jede dieser Zeilen auf unterschiedliche Ebenen gesetzt. Typische Werte wären der Mittelwert und 1 SD der interagierenden Variablen. Um dies zu verdeutlichen, stellen Sie sich vor, Sie haben nur zwei Variablen, und , und Sie haben eine Interaktion zwischen ihnen, und dass der Schwerpunkt Ihrer Studie ist. Dann können Sie eine einzelne Zeichnung mit diesen drei Linien erstellen:± x1 x2 x1
quelle
Hier ist ein webbasiertes, interaktives Tool zum Zeichnen von Regressionsergebnissen in drei Dimensionen .
Dieses 3D-Diagramm arbeitet mit einer abhängigen Variablen und zwei erklärenden Variablen. Sie können den Achsenabschnitt auch auf Null setzen (dh den Achsenabschnitt aus der Regressionsgleichung entfernen).
Die Grafiken erfordern einen WebGL-fähigen Browser. Die neuesten Versionen aller gängigen Desktop-Browser unterstützen WebGL.
quelle
Um das Modell und nicht die Daten zu visualisieren , verwendet JMP ein interaktives "Profiler" -Diagramm. Hier ist eine statische Ansicht.
Und hier ist ein Link zu einer dynamischen Ansicht .
Es ähnelt Ihrer Scatter-Plot-Idee und kann damit kombiniert werden. Die Idee ist, dass jeder Frame einen Ausschnitt des Modells für die entsprechenden X- und Y-Variablen zeigt, wobei die anderen X-Variablen auf ihren angegebenen Werten konstant gehalten werden. In der interaktiven Version können die X-Werte durch Ziehen der roten vertikalen Linien geändert werden.
Offenlegung: Ich bin ein JMP-Entwickler. Nehmen Sie dies also nicht als unvoreingenommene Bestätigung.
quelle