Kombination von zwei Konfidenzintervallen / Punktschätzungen

17

Angenommen, man hat zwei unabhängige Stichproben aus derselben Population, und für die beiden Stichproben wurden unterschiedliche Methoden verwendet, um die Punktschätzung und die Konfidenzintervalle abzuleiten. In trivialen Fällen bündelte eine vernünftige Person nur die beiden Proben und verwendete eine Methode, um die Analyse durchzuführen. Nehmen wir jedoch vorerst an, dass eine andere Methode angewendet werden muss, da eine der Proben eingeschränkt ist, z. B. fehlende Daten. Diese zwei getrennten Analysen würden unabhängige, gleichermaßen gültige Schätzungen für das interessierende Populationsattribut erzeugen. Intuitiv denke ich, dass es eine Möglichkeit geben sollte, diese beiden Schätzungen in Bezug auf Punktschätzung und Konfidenzintervall richtig zu kombinieren, was zu einem besseren Schätzverfahren führt. Meine Frage ist, was sollte der beste Weg sein, dies zu tun? Ich kann mir einen gewichteten Mittelwert vorstellen, der sich nach der Information / Stichprobengröße in jeder Stichprobe richtet, aber was ist mit den Konfidenzintervallen?

user1600
quelle

Antworten:

9

Sie können eine gepoolte Schätzung wie folgt durchführen. Sie können dann die gepoolten Schätzungen verwenden, um ein kombiniertes Konfidenzintervall zu generieren. Im Einzelnen sei gesagt:

x1¯N(μ,σ2n1)

x2¯N(μ,σ2n2)

Unter Verwendung der Konfidenzintervalle für die beiden Fälle können Sie die Standardfehler für die Schätzungen rekonstruieren und die obigen durch folgende ersetzen:

x1¯N(μ,SE1)

x2¯N(μ,SE2)

Eine gepoolte Schätzung wäre:

x¯=n1x1¯+n2x2¯n1+n2

Somit,

x¯N(μ,n12SE1+n22SE2(n1+n2)2)=N(μ,σ2n1+n2)

Gemeinschaft
quelle
1
β^±ZαSE
@ user1600 Guter Punkt.
Diese Antwort könnte auf zwei beliebige Verteilungen angewendet werden. Es ist nur so, dass das Produkt der Normalen eine Normalität ist und eine schöne Lösung ergibt. Die MCMC-Simulation könnte mit Verteilungspaaren ohne geschlossene Form verwendet werden, wobei ein Bayes'scher Ansatz verwendet wird, bei dem eine Stichprobe die Priorität und die andere die Wahrscheinlichkeit hat.
David LeBauer
Wenn Sie auf Konfidenzintervalle der gepoolten SE zurückgreifen, wie hoch wären dann die Freiheitsgrade für die T-Verteilung? Würde sich dies ändern, wenn mehr als zwei Konfidenzintervalle kombiniert würden?
DocBuckets
3

Klingt für mich nach Metaanalyse . Wenn Sie davon ausgehen, dass die Stichproben aus derselben Grundgesamtheit stammen, können Sie eine Metaanalyse mit festen Effekten (anstelle einer Metaanalyse mit zufälligen Effekten) verwenden. Die generische Inverse-Varianz-Methode verwendet eine Reihe unabhängiger Schätzungen und deren Varianzen als Eingabe, benötigt also nicht die vollständigen Daten und funktioniert auch dann, wenn für verschiedene Stichproben unterschiedliche Schätzer verwendet wurden. Die kombinierte Schätzung ist dann ein gewichteter Durchschnitt der getrennten Schätzungen, wobei jede Schätzung mit der Umkehrung ihrer Varianz gewichtet wird. Die Varianz der kombinierten Schätzung ist die Inverse der Summe der Gewichte (die Inversen der Varianzen).

Sie möchten auf einer Skala arbeiten, bei der die Stichprobenverteilung der Schätzung ungefähr normal ist, oder zumindest auf einer Skala, bei der die Konfidenzintervalle ungefähr symmetrisch sind. Daher ist eine logarithmisch transformierte Skala für Verhältnisschätzungen (Risikoverhältnisse, Quotenverhältnisse, Rate) üblich Verhältnisse ...). In anderen Fällen wäre eine Varianzstabilisierungstransformation sinnvoll, z. B. eine Quadratwurzeltransformation für Poisson-Daten, eine Arcussin-Quadratwurzel-Transformation für Binomialdaten usw.

ein Stop
quelle
1

Dies ist einer geschichteten Stichprobe nicht unähnlich. Das Zusammenfassen der Stichproben für eine Punktschätzung und einen Standardfehler erscheint daher als angemessener Ansatz. Die beiden Stichproben würden nach Stichprobenanteil gewichtet.

Brett
quelle