Ich habe eine binäre logistische Regression mit nur einem binären Prädiktor für feste Faktoren. Der Grund, warum ich es nicht als Chi-Quadrat oder als exakten Fisher-Test mache, ist, dass ich auch eine Reihe von Zufallsfaktoren habe (es gibt mehrere Datenpunkte pro Person und Einzelpersonen sind in Gruppen, obwohl mir Koeffizienten oder Signifikanzen egal sind für diese Zufallsvariablen). Ich mache das mit R glmer.
Ich möchte in der Lage sein, den Koeffizienten und das zugehörige Konfidenzintervall für den Prädiktor als Risikoverhältnis und nicht als Quotenverhältnis auszudrücken. Dies liegt daran, dass das Risikoverhältnis (möglicherweise nicht für Sie, sondern für mein Publikum) viel einfacher zu verstehen ist. Das Risikoverhältnis ist hier der relative Anstieg der Wahrscheinlichkeit, dass das Ergebnis 1 statt 0 ist, wenn der Prädiktor 1 statt 0 ist.
Das Odds Ratio ist trivial, um mit exp () den Koeffizienten und das zugehörige CI zu ermitteln. Um ein Odds Ratio in ein Risikoverhältnis umzuwandeln, können Sie "RR = OR / (1 - p + (px OR)) verwenden, wobei p das Risiko in der Kontrollgruppe ist" (Quelle: http: //www.r- bloggers.com/how-to-convert-odds-ratios-to-relative-risks/). Sie benötigen jedoch das Risiko in der Kontrollgruppe, was in meinem Fall die Wahrscheinlichkeit bedeutet, dass das Ergebnis 1 ist, wenn der Prädiktor 0 ist. Ich glaube, der Intercept-Koeffizient aus dem Modell ist tatsächlich die Wahrscheinlichkeit für diese Chance, also kann ich verwenden prob = Odds / (Odds + 1), um das zu bekommen. Was die zentrale Schätzung der Risikokennzahl angeht, bin ich in dieser Hinsicht ziemlich weit. Was mich jedoch beunruhigt, ist das zugehörige Konfidenzintervall, da dem Intercept-Koeffizienten auch ein eigenes CI zugeordnet ist. Sollte ich die zentrale Schätzung des Abschnitts verwenden oder konservativ sein, sollte ich die Grenzen des Abschnitts-CI verwenden, die mein relatives Risiko-CI am breitesten machen? Oder belle ich den falschen Baum ganz an?
Antworten:
Zhang 1998 stellte ursprünglich eine Methode zur Berechnung von CIs für Risikoverhältnisse vor, die darauf hindeutet, dass Sie die Unter- und Obergrenze des CI für das Odds Ratio verwenden könnten.
Diese Methode funktioniert nicht, ist voreingenommen und führt im Allgemeinen zu antikonservativen (zu engen) Schätzungen des Risikoverhältnisses von 95% CI. Dies liegt an der Korrelation zwischen dem Intercept-Term und dem Slope-Term, auf die Sie richtig anspielen. Wenn das Odds Ratio zu seinem niedrigeren Wert im CI tendiert, erhöht sich der Intercept-Term, um eine höhere Gesamtprävalenz bei Personen mit einem Expositionsniveau von 0 und umgekehrt einen höheren Wert im CI zu berücksichtigen. Jedes von diesen führt jeweils zu unteren und oberen Grenzen für das CI.
Um Ihre Frage direkt beantworten zu können, benötigen Sie Kenntnisse über die Grundprävalenz des Ergebnisses, um korrekte Konfidenzintervalle zu erhalten. Daten aus Fall-Kontroll-Studien würden sich auf andere Daten stützen, um dies zu informieren.
Alternativ können Sie die Delta-Methode verwenden, wenn Sie die vollständige Kovarianzstruktur für die Parameterschätzungen haben. Eine äquivalente Parametrisierung für die OR-zu-RR-Transformation (mit binärer Belichtung und einem einzelnen Prädiktor) ist:
Und unter Verwendung der multivariaten Delta-Methode und des zentralen Grenzwertsatzes, der besagt, dass können Sie die Varianz der ungefähren Normalverteilung der . RRn−−√([β^0,β^1]−[β0,β1])→DN(0,I−1(β)) RR
Beachten Sie, dass dies notatorisch nur für binäre Belichtung und univariate logistische Regression funktioniert. Es gibt einige einfache R-Tricks, die die Delta-Methode und die marginale Standardisierung für kontinuierliche Kovariaten und andere Anpassungsvariablen verwenden. Aber der Kürze halber werde ich das hier nicht diskutieren.
Es gibt jedoch mehrere Möglichkeiten, die relativen Risiken und ihren Standardfehler direkt aus den Modellen in R zu berechnen. Zwei Beispiele hierfür:
http://research.labiomed.org/Biostat/Education/Case%20Studies%202005/Session4/ZhangYu.pdf
quelle
AdamO (oder irgendjemand!), Könnten Sie mir helfen? Ich habe dieses reproduzierbare Beispiel basierend auf dem Code von AdamO erstellt:
Dieses Beispiel zeigt, dass das aus einer logistischen Regression berechnete Quotenverhältnis mit dem von Hand berechneten Quotenverhältnis übereinstimmt. Das vom Cox-Modell berechnete relative Risiko stimmt jedoch nicht mit dem von Hand berechneten relativen Risiko überein.
Habe ich etwas verpasst?
quelle