Ich versuche eine OLS-Regression durchzuführen:
DV: Gewichtsänderung über ein Jahr (Anfangsgewicht - Endgewicht)
IV: Ob Sie trainieren oder nicht.
Es erscheint jedoch vernünftig, dass schwerere Menschen mehr Gewicht pro Trainingseinheit verlieren als dünnere. Daher wollte ich eine Kontrollvariable einfügen:
- CV: Anfangsstartgewicht.
Das Anfangsgewicht wird jetzt jedoch BEIDE verwendet, um die abhängige Variable AND als Steuervariable zu berechnen.
Ist das okay? Verstößt dies gegen eine Annahme von OLS?
regression
repeated-measures
least-squares
change-scores
ChrisStata
quelle
quelle
Antworten:
Um Ihre wörtliche Frage zu beantworten: "Ist es gültig, ein Basismaß als Kontrollvariable einzuschließen, wenn die Auswirkung einer unabhängigen Variablen auf die Änderungsergebnisse getestet wird?", Lautet die Antwort " Nein" . Die Antwort lautet Nein, da die Basisbewertung konstruktionsbedingt mit dem Fehlerterm korreliert, wenn die Änderungsbewertung als abhängige Variable verwendet wird. Daher ist der geschätzte Effekt der Basisbewertung auf die Änderungsbewertung nicht interpretierbar.
Verwenden
Man hat dann ein Modell, das auf und ; T XΔY T X
Was per definitionem äquivalent ist zu;
Wenn Sie nun die Basislinie als Kovariate , sollte ein Problem auftreten, da Sie den Term auf beiden Seiten der Gleichung haben. Dies zeigt, dass nicht ist, da es inhärent mit dem Fehlerterm korreliert.β 3 Y 1Y1 β3Y1
Nun scheint ein Teil der Verwirrung in den verschiedenen Antworten auf die Tatsache zurückzuführen zu sein, dass verschiedene Modelle identische Ergebnisse für den Behandlungseffekt liefern , in meiner obigen Formulierung. Wenn man also den Behandlungseffekt für das Modell unter Verwendung von Änderungswerten als abhängige Variable mit dem Modell unter Verwendung der "Ebenen" vergleicht (wobei jedes Modell die Grundlinie als Kovariate enthält), ist die Interpretation des Behandlungseffekts die gleich. In den beiden folgenden Modellen sind und die darauf basierenden Schlussfolgerungen gleich (Bruce Weaver hat auch SPSS-Code veröffentlicht, der die Gleichwertigkeit demonstriert).Y 1 β 1 Tβ1T Y1 β1T
Einige werden sich also streiten (wie Felix in diesem Thread und Bruce Weaver in einigen Diskussionen über die SPSS-Google-Gruppe)) Da die Modelle den gleichen geschätzten Behandlungseffekt haben, spielt es keine Rolle, welchen Sie wählen. Ich bin anderer Meinung, da die Basiskovariate im Änderungsbewertungsmodell nicht interpretiert werden kann, sollten Sie die Basiskovariate niemals als Kovariate einbeziehen (unabhängig davon, ob der geschätzte Behandlungseffekt derselbe ist oder nicht). Dies wirft also eine andere Frage auf: Was nützt es, die Änderungswerte als abhängige Variablen zu verwenden? Wie Felix bereits bemerkte, unterscheidet sich das Modell, das den Änderungswert als abhängige Variable ohne die Basislinie als Kovariate verwendet, von dem Modell, das die Ebenen verwendet. Zur Verdeutlichung werden in den nachfolgenden Modellen unterschiedliche Behandlungseffekte angegeben (insbesondere für den Fall, dass die Behandlung mit dem Ausgangswert korreliert).
Dies wurde in der Literatur als "Lord's Paradox" bezeichnet. Welches Modell ist also richtig? Nun, im Fall von randomisierten Experimenten würde ich sagen, dass das Levels-Modell vorzuziehen ist (obwohl der durchschnittliche Behandlungseffekt zwischen den Modellen sehr nahe sein sollte, wenn Sie eine gute Arbeit beim Randomisieren geleistet haben). Andere haben Gründe genannt, warum das Level-Modell vorzuziehen ist. Charlies Antwort macht einen guten Punkt darin, dass Sie Interaktionseffekte mit der Grundlinie im Level-Modell abschätzen können (aber nicht im Change-Score-Modell). Whuber zeigt in dieser Antwort auf eine sehr ähnliche Frage, wie die Änderungswerte Korrelationen zwischen verschiedenen Behandlungen induzieren.
In Situationen, in denen die Behandlung nicht zufällig zugeordnet wird, sollte das Modell, das Änderungswerte als abhängige Variable verwendet, stärker berücksichtigt werden. Der Hauptvorteil des Change-Score-Modells besteht darin, dass jederzeit invariante Prädiktoren des Ergebnisses kontrolliert werden. Angenommen, in der obigen Formulierung ist über die gesamte Zeit konstant (zum Beispiel, wenn eine genetische Veranlagung ein bestimmtes Gewicht hat), und korreliert damit, ob eine Person trainiert (und nicht beobachtet wird). In diesem Fall ist das Änderungsbewertungsmodell vorzuziehen. Auch in Fällen, in denen die Auswahl in die Behandlung mit dem Grundlinienwert korreliert, kann das Änderungsbewertungsmodell vorzuziehen sein. Paul Allison in seiner Zeitung,X X X Die Ergebnisse als abhängige Variablen in der Regressionsanalyse ändern , enthält dieselben Beispiele (und hat meine Sichtweise auf das Thema stark beeinflusst, daher empfehle ich dringend, sie zu lesen).
Das soll nicht heißen, dass Änderungsergebnisse in nicht zufälligen Einstellungen immer vorzuziehen sind. In dem Fall, dass Sie erwarten, dass die Baseline einen tatsächlichen kausalen Effekt auf das Post-Gewicht hat, sollten Sie das Level-Modell verwenden. Wenn Sie erwarten, dass die Baseline einen kausalen Effekt hat und die Auswahl der Behandlung mit der Baseline korreliert, wird der Behandlungseffekt mit dem Baseline-Effekt verwechselt.
Ich habe die Anmerkung von Charlie ignoriert, dass der Logarithmus des Gewichts als abhängige Variable verwendet werden könnte. Ich bezweifle zwar nicht, dass dies eine Möglichkeit sein könnte, aber es ist keine Folge der ursprünglichen Frage. In einer anderen Frage wurde erörtert, wann die Logarithmen der Variablen verwendet werden sollten (und diese gelten in diesem Fall immer noch). Es gibt wahrscheinlich bereits Literatur zu diesem Thema, anhand derer Sie feststellen können, ob die Verwendung des protokollierten Gewichts ebenfalls angemessen ist.
Zitat
Allison, Paul D. 1990. Änderungswerte als abhängige Variablen in der Regressionsanalyse . Sociological Methodology 20: 93 & ndash; 114. Öffentliche PDF-Version .
quelle
Andys Antwort scheint die Sichtweise des Ökonomen zu sein. In klinischen Studien ist es gängige Praxis, sich fast immer an die Basisversion der Antwortvariablen anzupassen, um die Leistung erheblich zu steigern. Da wir die Basisvariablen als Bedingung verwenden, gibt es keinen 'Fehlerterm', der mit dem Gesamtfehlerterm verwechselt werden könnte. Das einzige Problem wäre, wenn Messfehler in der Basiskovariate mit einem anderen X verwechselt würden, was den Effekt dieses anderen X verzerrt. Die insgesamt bevorzugte Methode besteht darin, die Basislinie anzupassen und die Antwortvariable zu modellieren, ohne die Änderung zu berechnen. Ein Grund dafür ist, dass Änderungen stark davon abhängen, ob die Transformation von Y korrekt ist, und dass diese Änderungen im Allgemeinen nicht für Regressionsmodelle gelten. Wenn beispielsweise Y eine Ordnungszahl ist, ist die Differenz zwischen zwei Ordnungszahlvariablen nicht länger eine Ordnungszahl.
quelle
Wir können die Argumentation von @ ocram leicht ändern, damit
Also, wenn dies das richtige Modell , sagte , dass der Unterschied hängt von dem Gewicht bedeutet , dass der Endwert hängt von dem Anfangswert mit einem Koeffizienten, der alles sein könnte. eine Regression der Differenz für und oder des Endgewichts für dieselben Variablen , sollten Sie für alle dieselben Koeffizienten . Wenn dieses Modell jedoch nicht genau stimmt, führen diese Regressionen auch bei den anderen Koeffizienten zu unterschiedlichen Ergebnissen.x w0 w0
Beachten Sie, dass dies bedeutet , eingerichtet, dass das Ausgangsgewicht der vorhersagt Unterschied in Gewichte, nicht die Auswirkungen der Behandlung . Dies würde einen Interaktionsterm erfordern, vielleicht
Ein anderer Ansatz wäre, zu berechnen hier ist die Wachstumsrate des Gewichts. Dies könnte Ihr Ergebnis sein. Ihre Koeffizienten für sagen Ihnen, wie diese Prädiktoren mit Gewichtsveränderungen im Verhältnis stehen. Dies "kontrolliert" das anfängliche Gewicht, indem es besagt, dass zum Beispiel ein Trainingsprogramm, das das Gewicht um 10% reduziert (ein Koeffizient von 0,1 multipliziert mit 100%), für jemanden, der 130 Pfund wiegt, das Gewicht um 13 Pfund reduziert, während das Programm das Gewicht reduziert Gewicht eines 200 Pfund Teilnehmers um 20 Pfund. In diesem Fall müssen Sie möglicherweise nicht das Anfangsgewicht (oder sein Protokoll) auf der rechten Seite einfügen.
Ein Interaktionsbegriff kann dennoch erforderlich sein, wenn Sie der Meinung sind, dass die Wirkung des Programms vom Startgewicht abhängt. Wenn Sie im Interaktionsbegriff verwenden, ist das Programm mit einer Änderung der Wachstumsrate des Gewichts von . Jedes Pfund, das zu Beginn des Programms schwerer war als eine Person, führt zu einem Anstieg der Veränderung der Wachstumsrate um (dies ist die partielle Kreuzableitung des Erwartungswerts sowohl in Bezug auf die Behandlung als auch auf das Anfangsgewicht).w0 w0β1 β1
Wenn Sie im Interaktionsbegriff verwenden, erhöht sich die Auswirkung des Programms um für jedes zusätzliche Pfund, das der Teilnehmer zu Beginn des Programms schwerer war.β 1 / w 0log(w0) β1/w0
Wie Sie sehen, ist die Interpretation der Crosspartials zu Interaktionsbegriffen möglicherweise etwas schwierig, sie erfassen jedoch möglicherweise die Auswirkungen, an denen Sie interessiert sind.
quelle
BEARBEITEN: Andy Ws Argument überzeugte mich, Modell C fallen zu lassen. Ich fügte eine weitere Möglichkeit hinzu: Analyse von Änderungen mit Zufallskoeffizientenmodellen (auch bekannt als Multilevel-Modelle oder Mixed-Effect-Modelle)
Es gab viele wissenschaftliche Debatten über die Verwendung von Differenzwerten. Meine Lieblingstexte sind Rogosa (1982, [1]) und Fitzmaurice, Laird & Ware (2004, [2]).
Im Allgemeinen haben Sie drei Möglichkeiten, Ihre Daten zu analysieren:
C) Nehmen Sie den Differenzwert als DV und kontrollieren Sie ihn für die Basislinie (das ist das von Ihnen vorgeschlagene Modell).Aufgrund der Argumente von Andy W habe ich diese Alternative fallen gelassenDie Modelle A und B können sehr unterschiedliche Ergebnisse liefern, wenn die Basislinie mit dem Änderungswert korreliert ist (z. B. haben schwerere Personen einen höheren Gewichtsverlust) und / oder die Behandlungszuordnung mit der Basislinie korreliert ist.
Wenn Sie mehr über diese Themen erfahren möchten, lesen Sie die zitierten Artikel oder hier und hier .
Kürzlich wurde auch eine Simulationsstudie durchgeführt [3], in der empirisch die Bedingungen verglichen werden, unter denen A oder B vorzuziehen sind.
Für vollständig ausgeglichene Entwürfe ohne fehlende Werte sollte Modell D dem Modell A entsprechen. Es bietet jedoch mehr Informationen über die Variabilität zwischen Personen, lässt sich leicht auf mehr Messpunkte erweitern und hat gute Eigenschaften bei nicht ausgeglichenen Daten und / oder fehlende Werte.
Fazit: In Ihrem Fall würde ich die für die Baseline kontrollierten Post-Measures analysieren (Modell B).
[1] Rogosa, D., Brandt, D. & Zimowski, M. (1982). Ein Wachstumskurven-Ansatz zur Messung von Veränderungen. Psychological Bulletin, 92, 726 & ndash; 748.
[2] Fitzmaurice, GM, Laird, NM & Ware, JH (2004). Angewandte Längsschnittanalyse. Hoboken, NJ: Wiley.
[3] Petscher, Y. & Schatschneider, C., 2011. Eine Simulationsstudie zur Leistung der einfachen differenz- und kovarianzangepassten Scores in randomisierten experimentellen Designs. Journal of Educational Measurement, 48, 31-43.
quelle
Laird, N. (1983). Further Comparative Analyses of Pretest-Posttest Research Designs. The American Statistician, 37, 329-330.
?, wer zeigt eine Äquivalenz von B und C?Siehe Josh Angrist zu genau dieser Frage: http://www.mostlyharmlesseconometrics.com/2009/10/adding-lagged-dependent-vars-to-differenced-models/ . Er spricht sich weitgehend dagegen aus, das verzögerte DV in Ihr Modell aufzunehmen. Seine Antwort enthält nichts, was nicht in den obigen Antworten enthalten ist, aber eine weitere prägnante Antwort auf Ihre Frage kann hilfreich sein.
quelle
Glymour et al. (2005) unter Verwendung der Baseline-Anpassung bei der Analyse einer Änderungsbewertung angesprochen. Wenn die Änderung des Gesundheitszustands vor der Basisbewertung erfolgte oder ein großer Messfehler in der abhängigen Variablen vorliegt, stellen sie fest, dass eine Verzerrung auftreten kann, wenn das Regressionsmodell, das den Änderungswert als abhängige Variable verwendet, eine Basiskovariate enthält. Frank Harrells Antwort "Das einzige Problem wäre, wenn Messfehler in der Basiskovariate mit einem anderen X verwechselt würden, was den Effekt dieses anderen X verzerrt." kann die gleiche Tendenz wie Glymour-Adressen widerspiegeln.
Glymour (2005) "Wann ist eine Grundlinienanpassung bei der Analyse von Veränderungen nützlich? Ein Beispiel für Bildung und kognitive Veränderungen. American Journal of Epidemiology 162: 267-278
quelle
Ocram ist nicht korrekt. Die Gewichtsdifferenz berücksichtigt nicht das Anfangsgewicht. Insbesondere wird das Anfangsgewicht durch Subtrahieren des Endgewichts von ihm herausgenommen.
Daher würde ich argumentieren, dass es keine Annahmen verletzt, wenn Sie für das Anfangsgewicht kontrollieren.
(Dieselbe Logik gilt, wenn Sie den Unterschied zwischen dem BMI und dem anfänglichen BMI nehmen.)
Update
Nachdem Andy W kritisiert hat, möchte ich genauer erklären, warum ich richtig und Ocram falsch liege (zumindest aus meiner Sicht).
Es gibt ein absolutes Gewichtsniveau, das jede Person hat (z. B. ungefähr 100 Pfund im Gegensatz zu 200 Pfund). Sei dieses absoulte Gewicht. Dann kann das Anfangsgewicht als und das Endgewicht alsi w = a w e w = a w + Δ waw
iw=aw ew=aw+Δw
Der dv, den das OP verwenden möchte, ist somitΔw=iw−ew=aw−aw+Δw=Δw
Mit anderen Worten, das absolute Gewichtsniveau (formalisiert als ) fällt aus der Gleichung, die das dv darstellt, heraus und kontaminiert es daher nicht (was der Behauptung von Andy W widerspricht).aw
Wenn Sie dies berücksichtigen möchten, müssen Sie es separat in Ihr Modell integrieren (als gewöhnlicher Parameter und / oder als Interaktionsbegriff).
Offensichtlich gilt dieselbe Logik für und kann leicht in Proportionen gebracht werden, in denen man zB sagen würde:ΔBMJ ew=aw∗propΔw
quelle
Beachten Sie das
ist äquivalent zu
In Worten, die Verwendung der Gewichtsänderung (anstelle des Endgewichts selbst) als DV berücksichtigt bereits das Anfangsgewicht.
quelle