Rücktransformierte Konfidenzintervalle

11

Nachdem ich auf diese Diskussion gestoßen bin, stelle ich die Frage nach den Konventionen für rücktransformierte Konfidenzintervalle.

Gemäß diesem Artikel beträgt der rücktransformierte CI der nominalen Abdeckung für den Mittelwert einer logarithmisch normalen Zufallsvariablen:

LCL(X)=exp(Y+var(Y) UCL(X)=exp(Y+var(Y)2+zvar(Y)n+var(Y)22(n1))  LCL(X)=exp(Y+var(Y)2zvar(Y)n+var(Y)22(n1))

/ und nicht die naive /exp((Y)+zvar(Y))

Was sind solche CIs für die folgenden Transformationen:

  1. undx 1 / 3xx1/3
  2. arcsin(x)
  3. log(x1x)
  4. 1/x

Wie wäre es mit dem Toleranzintervall für die Zufallsvariable selbst (ich meine einen einzelnen Stichprobenwert, der zufällig aus der Grundgesamtheit gezogen wird)? Gibt es das gleiche Problem mit den rücktransformierten Intervallen oder haben sie die nominelle Abdeckung?

Germaniawerks
quelle
1
Siehe Taylor-Erweiterung für Momente der Funktionen von Wohnmobilen und die Delta-Methode . Aber Vorsicht ist geboten. Siehe zum Beispiel die Diskussion hier und [hier] (stats.stackexchange.com/questions/41896/varx-is-known-how-to-calculate-var1-x/). Die Suche in Taylor-Serien wird einige nützliche Beispiele und Diskussionen präsentieren.
Glen_b -State Monica
Ich habe Ihre Formeln erheblich überarbeitet. Bitte überprüfen Sie, ob ich nichts falsch gemacht habe. Zu meinem vorherigen Kommentar (Entschuldigung für den falsch formatierten Link dort) - siehe auch den vorsorglichen Kommentar unter der Antwort hier
Glen_b
Vielen Dank. Obwohl ich kaum etwas posten kann, ohne mit diesen ausgefallenen Ausdrücken bearbeitet zu werden.
Germaniawerks

Antworten:

6

Warum machst du überhaupt Rücktransformationen? Dies ist für die Beantwortung Ihrer Frage von entscheidender Bedeutung, da in einigen Fällen die naive Transformation die richtige Antwort ist. Tatsächlich denke ich, dass ich argumentieren sollte, wenn die naive Rücktransformation nicht die richtige Antwort ist, sollten Sie überhaupt keine Rücktransformation durchführen.

Ich finde das allgemeine Problem der Rücktransformation sehr problematisch und oft mit verwirrtem Denken gefüllt. Wenn Sie sich den von Ihnen zitierten Artikel ansehen, warum denken sie dann, dass es eine vernünftige Frage ist, dass das rücktransformierte CI nicht den ursprünglichen Mittelwert erfasst? Es ist eine falsche Interpretation von rücktransformierten Werten. Sie denken, dass die Abdeckung für die direkte Analyse im rücktransformierten Raum sein sollte. Und dann erstellen sie eine Rücktransformation, um diesen Fehler zu beheben, anstatt sie zu interpretieren.

Wenn Sie Ihre Analysen zu Protokollwerten durchführen, gelten Ihre Schätzungen und Schlussfolgerungen für diese Protokollwerte. Solange Sie eine Rücktransformation als Darstellung dessen betrachten, wie diese Protokollanalyse im exponentiellen Raum aussieht, und nur so, sind Sie mit dem naiven Ansatz einverstanden. In der Tat ist es genau. Das gilt für jede Transformation.

Das zu tun, was sie tun, löst das Problem, das CI in etwas zu verwandeln, das es nicht ist, ein CI der transformierten Werte. Dies ist mit Problemen behaftet. Betrachten Sie die Bindung, in der Sie sich gerade befinden, die zwei möglichen CIs, eine im transformierten Raum, in dem Sie Ihre Analysen durchführen, und eine rücktransformierte, machen sehr unterschiedliche Aussagen darüber, wo sich das wahrscheinliche mu im anderen Raum befindet. Die empfohlene Rücktransformation verursacht mehr Probleme als sie löst.

Das Beste, was Sie aus diesem Papier herausholen können, ist, dass die Entscheidung, die Daten zu transformieren, tiefere Auswirkungen als erwartet auf die Bedeutung Ihrer Schätzungen und Schlussfolgerungen hat.

John
quelle
Könnten Sie das bitte weiter erläutern? Es scheint mir, dass das Problem, dass das naive CI eher das geometrische Mittel als die Arithmetik ergibt. Was bedeuten würde, dass es streng kleiner sein würde, wie sie sagen, und daher die Inkonsistenz und die schlechte Abdeckung.
Germaniawerks
Inkonsistenz mit was? Wenn Sie Ihre Exponentialverteilung direkt analysieren und den arithemtischen Mittelwert kennen wollen, dann ist dies eine schlechte Abdeckung. Aber wenn du das machen wolltest, hättest du das tun sollen. Wenn Sie Ihre Distribution protokollieren, transformieren und die Exponenten analysieren möchten, ist dies genau die richtige Abdeckung.
John
Ich kann nicht verstehen, warum Sie gegen die Methode im Artikel protestieren. Die Simulationen zeigen, dass es gut funktioniert, während die naive Methode schlechter abschneidet als der "Central-Limit-Ansatz".
Germaniawerks
1
Sie zeigen, dass es besser läuft, als sie es wollen. Die naive Methode funktioniert gut für das, was es ist. Schauen Sie sich die Simulation in Abschnitt 5 an. Sie legen einen Normalverteilungsmittelwert 5 fest, der einen Exponenten von 148,4 hat. Dann diskutieren sie die Berichterstattung über den Mittelwert von 244,6 !! Dies wäre nur wichtig, wenn Sie den Mittelwert der ursprünglichen Verteilung modellieren, NICHT die Protokolle. Sie versuchen, etwas daraus zu machen, was es nicht ist. Die naive Berechnung deckt den Mittelwert des Protokolls perfekt ab. 5. Keines der anderen CIs ist zu 95% CIs dieses Werts, und das ist dasjenige, das Sie analysieren.
John