Ich wäre dankbar für Ratschläge, wie ich mit der folgenden Situation umgehen soll: Ich habe eine Zählvariable X und vier binäre Variablen A, B, C, D. Die Zählvariable ist die unabhängige Variable (sie bezieht sich auf die Anzahl der nachteiligen Erfahrungen in der Kindheit ) und die Binärdateien sind abhängige Variablen (sie beziehen sich auf bestimmte nachteilige Ergebnisse im Erwachsenenalter). Ein Befragter im Datensatz kann eine beliebige Kombination von Ergebnissen haben, z. B. A, AC, BCD usw. Ich möchte die Stärke der Assoziation zwischen der Zählvariablen X und den Ergebnissen A, B, C, D messen, abhängig von den Ebenen der andere Ergebnisse.
Ich bin mir nicht sicher, wie ich das am besten angehen soll. Wäre es gerechtfertigt, die Rolle von Variablen umzukehren und die Zählvariable X als Ergebnis und AD als Prädiktoren zu behandeln? Dies wäre also eine negative binomiale Regression (es gibt eine Überdispersion). Auf diese Weise würde die Assoziation zwischen X und A (B, C…) geschätzt, wenn andere binäre Variablen konstant gehalten würden. Aber es scheint mir, dass es logischerweise zwielichtig wäre, wenn wir etwas vorhersagen würden, das früher passiert ist, mit etwas, das später passiert ist.
Oder sollte ich stattdessen MANOVA verwenden (aber ich habe irgendwo gelesen, dass die Interpretation der Ergebnisse nicht einfach ist).
Oder sollte ich ein verallgemeinertes lineares gemischtes Modell verwenden (noch nie zuvor ausprobiert), wie hier vorgeschlagen https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2798811/ .
measure the strength of the association between the count variable X and the outcomes A, B, C, D conditional on the levels of the other outcomes
Diese "Bedingung" legt nahe, dass tatsächlich die binären Ergebnisse die Prädiktoren sind.predicting something that happened earlier with something that happened later
ist kein Problem, da wir uns im Bereich der Analyse befinden, nicht der "Natur".Antworten:
Sie gehen davon aus, dass alle Ereignisse in der Kindheit bei der Vorhersage der Ergebnisse für Erwachsene das gleiche Gewicht haben. Angesichts dessen gibt es jedoch mehrere Möglichkeiten, um fortzufahren. Hier sind drei Hauptansätze, von denen Sie bereits einen erwähnt haben.
Sie haben Ihre Stichprobengröße nicht erwähnt, aber das könnte ein Problem sein. Es sind mindestens 96 Beobachtungen erforderlich, um einen einfachen Einzelanteil ohne Kovariaten abzuschätzen.
quelle
Das multivariate Probit-Modell könnte in Betracht gezogen werden, wie in dem von Frank Harrell erwähnten Greene-Buch beschrieben. Siehe auch (Lesaffre und Mohlenberghs, 1991 Stat. Med 10, 1391-1403). Die Idee ist, sich eine multivariate Normalverteilung (4 Dimensionen) der Neigung oder Toleranz gegenüber jedem Ereignis vorzustellen. Sie modellieren den multivariaten Normalmittelvektor als vier Funktionen der unabhängigen Variablen. Schätzen Sie die Wahrscheinlichkeit jedes Ereignisses bei gegebenem Mittelwertvektor über die Probit-Link-Funktion.
Google das Greene-Buch. Sie finden einige nützliche "Links".
quelle