Die Frage betrifft meiner Meinung nach marginale Effekte (von X auf Y), nicht so sehr die Interpretation einzelner Koeffizienten. Wie die Leute sinnvollerweise bemerkt haben, sind diese nur manchmal mit einer Effektgröße identifizierbar, z. B. wenn lineare und additive Beziehungen bestehen.
Wenn dies der Schwerpunkt ist, scheint die (konzeptionell, wenn nicht praktisch) einfachste Art, über das Problem nachzudenken, folgende zu sein:
Um den marginalen Effekt von X auf Y in einem linearen normalen Regressionsmodell ohne Interaktionen zu bekommen, Sie können an der Koeffizient auf X. Aber sehen Sie nur das nicht ganz genug ist , da nicht bekannt geschätzt wird. In jedem Fall ist das, was man wirklich für Randeffekte wünscht, eine Art Diagramm oder Zusammenfassung, die eine Vorhersage über Y für einen Wertebereich von X und ein Maß für die Unsicherheit liefert. Typischerweise möchte man den vorhergesagten Mittelwert Y und ein Konfidenzintervall, aber man möchte auch Vorhersagen für die vollständige bedingte Verteilung von Y für ein X. Diese Verteilung ist breiter als die Sigma-Schätzung des angepassten Modells, da sie die Unsicherheit über die Modellkoeffizienten berücksichtigt .
Für einfache Modelle wie dieses gibt es verschiedene geschlossene Lösungen. Für aktuelle Zwecke können wir sie ignorieren und stattdessen allgemeiner darüber nachdenken, wie dieser Randeffektgraph durch Simulation auf eine Weise erhalten werden kann, die mit beliebig komplexen Modellen umgeht.
Angenommen, Sie möchten die Auswirkungen der Variation von X auf den Mittelwert von Y und möchten alle anderen Variablen auf einige aussagekräftige Werte festlegen. Nehmen Sie für jeden neuen Wert von X eine Stichprobe der Größe B aus der Verteilung der Modellkoeffizienten. Eine einfache Möglichkeit, dies in R zu tun, besteht darin, anzunehmen, dass es mit Mittelwert coef(model)
und Kovarianzmatrix normal ist vcov(model)
. Berechnen Sie für jeden Koeffizientensatz ein neues erwartetes Y und fassen Sie das Los mit einem Intervall zusammen. Fahren Sie dann mit dem nächsten Wert von X fort.
Es scheint mir, dass diese Methode von ausgefallenen Transformationen, die auf eine der Variablen angewendet werden, nicht beeinflusst werden sollte, vorausgesetzt, Sie wenden sie (oder ihre Inversen) auch in jedem Stichprobenschritt an. Wenn das angepasste Modell log (X) als Prädiktor hat, protokollieren Sie Ihr neues X, bevor Sie es mit dem abgetasteten Koeffizienten multiplizieren. Wenn das angepasste Modell sqrt (Y) als abhängige Variable hat, quadrieren Sie jeden vorhergesagten Mittelwert in der Stichprobe, bevor Sie sie als Intervall zusammenfassen.
Kurz gesagt, mehr Programmierung, aber weniger Wahrscheinlichkeitsberechnung und damit klinisch nachvollziehbare Randeffekte. Diese "Methode" wird in der politikwissenschaftlichen Literatur manchmal als CLARIFY bezeichnet, ist aber recht allgemein gehalten.