Reporting-Ergebnisse einer logistischen Regression

13

Ich habe die folgende logistische Regressionsausgabe:

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   0.5716     0.1734   3.297 0.000978 ***
R1           -0.4662     0.2183  -2.136 0.032697 *  
R2           -0.5270     0.2590  -2.035 0.041898 *  

Ist es angebracht, dies folgendermaßen zu melden:

Beta-Koeffizient, Odds Ratio, Z-Wert, P-Wert. Wenn ja, wie kann ich die Odds Ratio erhalten?

hoch oben
quelle
Verwandte Frage: Logistische Regression in R (Odds Ratio) .
Landroni

Antworten:

9

Ihre vorgeschlagene Berichterstellung für eine Tabelle erscheint sinnvoll, obwohl Z-Werte und P-Werte redundant sind. Viele mir vertraute Zeitschriften geben den Z-Wert / P-Wert überhaupt nicht an und verwenden nur Sternchen, um statistische Signifikanz zu melden. Ich habe auch Logistiktabellen nur mit den gemeldeten Quoten der Quote gesehen, obwohl ich persönlich sowohl die gemeldeten Log-Quoten als auch die gemeldeten Quoten-Quoten bevorzuge, wenn der Platz in einer Tabelle es zulässt.

Verschiedene Veranstaltungsorte können jedoch unterschiedliche Richtlinien für die Meldeverfahren haben, sodass die zu erwartenden Abweichungen auftreten können. Wenn ich einen Artikel in einer Zeitschrift einreiche, sehe ich häufig, wie andere aktuelle Artikel ihre Tabellen erstellt haben, und ahme diese nur nach. Wenn es sich um Ihr persönliches Dokument handelt, ist es eine vernünftige Bitte, zu fragen, wen Sie überprüfen. Wie ich bereits erwähnt habe, kann es sein, dass Sie aufgrund von Platzbeschränkungen an einigen Orten keine letztendlich redundanten Informationen (wie z. B. die Log-Quoten und die Quotenverhältnisse) melden können. Einige Stellen können Sie dazu zwingen, die Ergebnisse vollständig in Textform zu melden!

R2R2

eβ^eβ^exp(coefficient)

Auch als Notiz, obwohl dies die aktuell akzeptierte Antwort ist, geben lejohn und Frank Harrell beide sehr nützliche Ratschläge. Während ich normalerweise immer möchte, dass die Statistiken in der Frage irgendwo gemeldet werden, sind die anderen Ratschläge zu anderen Maßnahmen nützliche Methoden, um die Effektgrößen im Verhältnis zu anderen geschätzten Effekten im Modell zu bewerten. Grafische Verfahren sind auch nützlich, um die relativen Effektgrößen zu untersuchen. In diesen beiden Abhandlungen wird gezeigt, wie Tabellen in Diagramme umgewandelt werden ( Kastellec & Leoni, 2007 ; Gelman et al., 2002 ).

Andy W
quelle
Die Verknüpfung von Kastellec & Leoni, 2007 ist unterbrochen, aber hier ist ein Beispiel aus demselben Papier mit Code.
ACNB,
11

Die Antwort auf diese Frage hängt möglicherweise von Ihrem fachlichen Hintergrund ab.

Hier sind einige allgemeine Überlegungen.

Die Beta ist in logistischer Regression ziemlich schwer direkt zu interpretieren. Eine explizite Berichterstattung ist daher nur sehr eingeschränkt sinnvoll. Sie sollten sich an Odds Ratios oder sogar an marginale Effekte halten. Der marginale Effekt der Variablen x ist die Ableitung der Wahrscheinlichkeit, dass Ihre abhängigen Variablen in Bezug auf x gleich 1 sind. Diese Art der Darstellung von Ergebnissen ist unter Ökonomen sehr beliebt. Persönlich glaube ich, dass marginale Effekte für Laien (aber nicht nur für sie ...) leichter zu verstehen sind als Odds Ratios.

Eine weitere interessante Möglichkeit ist die Verwendung grafischer Anzeigen. Ein Ort, an dem Sie einige Illustrationen dieses Ansatzes finden, ist das Buch von Gelman und Hill . Ich finde das sogar besser, als marginale Effekte zu melden.

In Bezug auf die Frage, wie man Quotenverhältnisse erhält, ist hier, wie man es in R macht:

model <- glm(y ~ x1 + x2, family=binomial("logit"))
oddrat <- exp(coef(model))
Scortchi - Wiedereinsetzung von Monica
quelle
Haben Sie Beispiele für die Umwandlung der Grenzwertschätzungen in Tabellen (oder spezifische Seitenverweise in Gelman und Hill?)
Andy W
1
Gelman und Hill verwenden nicht wirklich die Randeffekte, sondern Grafiken, die auf vorhergesagten Wahrscheinlichkeiten basieren. Schauen Sie sich Kapitel 5 an, beginnend mit Seite 79.
10

Nur in besonderen Fällen sind die Koeffizienten und ihre Anti-Logs (Odds Ratios) gute Zusammenfassungen. Dies ist der Fall, wenn die Beziehungen linear sind und einem Prädiktor ein Koeffizient zugeordnet ist und wenn eine Änderung um eine Einheit eine gute Grundlage für die Berechnung des Gewinnchancenverhältnisses darstellt (mehr OK für das Alter, weniger für das weiße Blutbild mit einem Bereich von 500-100.000). Im Allgemeinen sind Dinge wie Quotenverhältnisse zwischen Quartilen nützlich. Ich habe mehr Details dazu unter http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/rms.pdf und das R- rmsPaket erledigt all dies automatisch (Umgang mit nichtlinearen Begriffen und Interaktionen, Berechnen von Quartilen von X, etc.).

Frank Harrell
quelle
5

Es hängt wahrscheinlich von Ihrem Publikum und Ihrer Disziplin ab. Die Antwort unten ist, was normalerweise für epidemiologische Zeitschriften und in geringerem Maße für medizinische Zeitschriften gemacht wird.

Um ehrlich zu sein, kümmern wir uns nicht um p-Werte. Im Ernst, wir tun es nicht.Die Epidemiologie lässt Sie nicht einmal über sie berichten, es sei denn, Sie haben ein wirklich dringendes Bedürfnis und das Feld ist im Wesentlichen gefolgt.

Abhängig von der Frage interessieren uns Beta-Schätzungen möglicherweise nicht einmal. Wenn Ihr Bericht eher methodisch oder simulationsorientiert ist, würde ich wahrscheinlich die Beta-Schätzung und den Standardfehler melden. Wenn Sie versuchen, einen in der Bevölkerung geschätzten Effekt zu melden, halte ich mich an das Odds Ratio und das 95% Confidence Interval. Das ist das Fleisch Ihrer Einschätzung und das, wonach Leser in diesem Bereich suchen werden.

Die oben genannten Antworten beziehen sich auf die Ermittlung des Quotenverhältnisses, jedoch auf den OR- und 95% -CI:

OR = exp(beta)
95% CI = exp(beta +/- 1.96*std error)
Fomite
quelle
Danke für die Antwort! Kann ich fragen, wofür die 1,96 in der Berechnung steht?
über dem
1
Kein Problem :) Das 95% -Konfidenzintervall ist die Spanne, die ungefähr das 2,5-ste Perzentil bis zum 97,5-ste Perzentil der Normalverteilung Ihrer Beta-Schätzung abdecken sollte. Jeder dieser Punkte entspricht ungefähr 1,96 Standardabweichungen vom Mittelwert (in diesem Fall Beta).
Fomite
Ja, aber soll ich das für jeden Beta-Koeffizienten tun? ändert sich auch die 1.96? Auch das sind Binomialdaten. Basiert es noch auf der Normalverteilung?
oben
2
Ja - für jeden Beta-Koeffizienten erhalten Sie eine Quote und ein 95% -Vertrauenslimit. Der Wert 1,96 wird nicht geändert, es sei denn, Sie möchten ein anderes Perzentil für das Konfidenzintervall (90%, 99% usw.) berechnen. Da jedoch 95% der Standardwert ist, ist dies nicht erforderlich. Und solange Sie an der Protokollskala arbeiten, werden die Parameter aus einem logistischen Regressionsmodell normal verteilt. Sobald Sie sie potenzieren, hört dies auf, wahr zu sein.
Fomite