Sicher schwer zu wissen, aber es gibt einige Gründe, warum die Link-Skala nützlich ist.
- Die Verwendung von Standardfehlern als Zusammenfassung der Unsicherheit ist auf der Verbindungsskala im Allgemeinen zuverlässiger, wenn der Bereich der Parameter unbegrenzt ist und die Annahme, dass die Wahrscheinlichkeitsfläche ungefähr quadratisch ist (↔Die Stichprobenverteilung der Parameterschätzungen ist ungefähr normal.) ist eher vernünftig. Angenommen, Sie haben ein Log-Link-Modell mit einer Schätzung (auf der Link-Skala) 1.0 und einem Standardfehler 3.0. Auf der Verbindungsskala beträgt das Konfidenzintervall ungefähr1±1.96×3. Wenn Sie eine Rücktransformation durchführen, den Parameter potenzieren und den Standardfehler mit dem potenzierten Parameter multiplizieren (wie in dieser Antwort ) und dann versuchen, symmetrische CIs zu erstellen, erhalten Sie2.718±1.96×3×2.718, die negative Werte enthält ... Wenn Sie eine Rücktransformation durchführen möchten, ist es sinnvoller, die Konfidenzintervalle rücktransformiert zu haben , d. hexp(1±1.96×3).
- Wahrscheinlich noch wichtiger ist, dass es für die sehr häufige Logit-Verknüpfung grundsätzlich unmöglich ist, die Parameter bis zur Datenskala (dh von Logit / Log-Odds-Verhältnissen zur Wahrscheinlichkeit) sinnvoll rücktransformiert zu machen. Es ist üblich, Parameter zu potenzieren, um von der Log-Odds-Ratio zur Odds-Ratio-Skala zu wechseln. Sie können jedoch nicht von Odds-Ratios zu Wahrscheinlichkeiten zurückkehren, ohne einen Basiswert anzugeben. Das heißt, Sie können im Allgemeinen sagen, "das mit Kontrolle vs. Behandlung verbundene Quotenverhältnis ist XXX", aber die Änderung der Wahrscheinlichkeit von Kontrolle zu Behandlung hängt von anderen Kovariaten ab (z. B. kann das Quotenverhältnis für Frauen und Männer gleich sein während die Änderung der Wahrscheinlichkeit unterschiedlich ist, da das Grundrisiko für Frauen und Männer unterschiedlich ist).
Wahrscheinlich liegt der proximale Grund darin, dass sich die meisten Leute, die viel statistische Modellierung durchführen, aufgrund der oben aufgeführten Probleme daran gewöhnt haben, Parameter auf der Link-Skala zu interpretieren. die meisten Epidemiologen und Biostatistikern müssen Zeit Lernen über Odds Ratios und Log-Odds Ratios, und es gibt viele verbringen Papiere geschrieben über ihre Interpretation. Ob gut oder schlecht, R wurde von Personen geschrieben, die Parameter auf der Link-Skala gut interpretieren können. Viele nachgelagerte Pakete wie Broom verfügen über Optionen, die Parameter und CIs für Sie potenzieren (indem Sie sie auf die Daten- (Zähl-) Skala für die Protokollverknüpfung, die Odds-Ratio-Skala für Logit-Links und die Hazard-Ratio-Skala für Cloglog-Links setzen). .