Können Steigungen in linearen Regressionen als unabhängige oder abhängige Variablen in anderen Regressionsmodellen verwendet werden?

8

Ich habe 100 Patienten und jeder Patient hat 10 longitudinale Serumkreatininmessungen. Die geschätzten glomerulären Filtrationsraten (eGFR) wurden aus einer MDRD-Formel berechnet, die Geschlecht, Alter und Serumkreatinin umfasste. eGFR ist die abhängige Variable und die Zeit ist die unabhängige Variable in der linearen Regression für jeden Patienten.

  1. Verstoßen lineare Regressionen gegen die Annahme des "unabhängigen X" und sollten stattdessen lineare gemischte Modelle verwendet werden?
  2. Können von jedem Patienten geschätzte eGFR-Steigungen (Schätzungen mit Unsicherheiten anstelle von gemessenen Zahlen) (in linearen Regressionen für jeden Patienten oder in gemischten Modellen mit zufälligen Effekten [wie werden Steigungen für jeden einzelnen Patienten in gemischten Modellen geschätzt?]) Als verwendet werden unabhängige oder abhängige Variablen in anderen Regressionsmodellen?

Vielen Dank.

Jinn-Yuh Guh
quelle
Wenn X (unabhängige Variablen) Messgrößen sind, handelt es sich um eine "Zufallsvariable" anstelle eines "festen Werts". Laut Wikipedia ( en.wikipedia.org/wiki/Random_variable ): "In Wahrscheinlichkeit und Statistik ist eine Zufallsvariable oder stochastische Variable grob gesagt eine Variable, deren Wert sich aus einer Messung eines zufälligen Prozesses ergibt." Hab ich recht?
Bitte verwenden Sie keine Antworten, um Fragen zu stellen. Sie können dieses Gespräch in Kommentaren fortsetzen. Eine andere Möglichkeit besteht darin, dies als Frage erneut zu posten und hierher zu verlinken.
whuber

Antworten:

5

Tatsächlich schlagen Sie vor, die lineare Regression als mathematisches Verfahren zu verwenden, um eine Beobachtung mit 10 Variablen in einer einzigen Variablen (der Steigung) zu verdichten. Als solches ist es nur ein weiteres Beispiel für ähnliche Verfahren wie (sagen wir) das Verwenden eines Durchschnitts wiederholter Messungen als Regressionsvariable oder das Einbeziehen von Hauptkomponentenwerten in eine Regression.

Spezifische Kommentare folgen.

(1) Für die lineare Regression müssen die X (unabhängigen Variablen) nicht "unabhängig" sein. In der Standardformulierung gilt das Konzept der Unabhängigkeit nicht einmal, da die X feste Werte sind, keine Realisierungen einer Zufallsvariablen.

(2) Ja, Sie können die Steigungen als abhängige Variablen verwenden. Es wäre hilfreich festzustellen, dass sie sich bei der linearen Regression möglicherweise wie die abhängige Variable verhalten. Für gewöhnliche kleinste Quadrate bedeutet dies, dass

ein. Steigungen können von einigen Patientenattributen abhängen.

b. Die Abhängigkeit ist zumindest für den Bereich der beobachteten Patientenattribute annähernd linear.

c. Jede Abweichung zwischen einer beobachteten Steigung und der hypothetischen Steigung kann als zufällig angesehen werden.

d. Diese zufällige Variation ist (i) unabhängig von Patient zu Patient und (ii) hat ungefähr die gleiche Verteilung von Patient zu Patient.

e. Nach wie vor werden die unabhängigen Variablen nicht als zufällig angesehen, sondern als fest und ohne nennenswerten Fehler gemessen.

Wenn alle diese Bedingungen ungefähr zutreffen, sollten Sie in Ordnung sein. Verstöße gegen (d) oder (e) können durch Verallgemeinerungen gewöhnlicher kleinster Quadrate geheilt werden.

(2 '). Da die Steigungen eine Unsicherheit aufweisen (gemessen in der zur Schätzung der Steigungen verwendeten Regression), sind sie möglicherweise keine guten Kandidaten für unabhängige Variablen, es sei denn, Sie behandeln sie in einem gemischten Modell als zufällig oder verwenden ein Modell für Fehler in Variablen.

Sie können diese Situation auch mit einem hierarchischen Bayes-Modell bewältigen .

whuber
quelle
Es tut mir leid für die falsche Bezeichnung "unabhängige X". Was ich meinte war "unabhängiges Y, abhängig von X". Die Residuen müssen nämlich unabhängig sein. Diese Annahme wird bei Längsschnittbeobachtungen verletzt. Referenz: Modellierung von Längsschnittdaten, II: Standard-Regressionsmodelle und -Erweiterungen. Methoden Mol Biol. 2009; 473: 61 & ndash; 94.
Jinn-Yuh Guh
Sie können mehr über die oben erwähnten 'Verallgemeinerungen der kleinsten Quadrate' von Lewis und Linzer 2005
Conjugateprior