Wie berechnet man das Konfidenzintervall des Mittelwerts?

19

Stellen Sie sich vor, Sie wiederholen ein Experiment dreimal. In jedem Experiment sammeln Sie dreifache Messungen. Die Triplikate sind im Vergleich zu den Unterschieden zwischen den drei experimentellen Mitteln eher eng beieinander. Die Berechnung des Mittelwerts ist ziemlich einfach. Aber wie kann man ein Konfidenzintervall für den Mittelwert berechnen?

Beispieldaten:

Experiment 1: 34, 41, 39

Experiment 2: 45, 51, 52

Experiment 3: 29, 31, 35

Angenommen, die Wiederholungswerte innerhalb eines Experiments folgen einer Gaußschen Verteilung, ebenso wie die Mittelwerte jedes Experiments. Die SD der Variation innerhalb eines Experiments ist unter den experimentellen Mitteln kleiner als die SD. Es sei auch angenommen, dass es in jedem Experiment keine Reihenfolge der drei Werte gibt. Die Reihenfolge der drei Werte in jeder Zeile von links nach rechts ist völlig willkürlich.

Der einfache Ansatz besteht darin, zuerst den Mittelwert jedes Experiments zu berechnen: 38,0, 49,3 und 31,7, und dann den Mittelwert und das 95% -Konfidenzintervall dieser drei Werte zu berechnen. Mit dieser Methode ergibt sich ein Mittelwert von 39,7, wobei das 95% -Konfidenzintervall zwischen 17,4 und 61,9 liegt.

Das Problem bei diesem Ansatz ist, dass die Variation zwischen den Dreifachwerten völlig ignoriert wird. Ich frage mich, ob es keinen guten Weg gibt, diese Variation zu erklären.

Harvey Motulsky
quelle
1
Keine Antwort, nur eine intuitive Beobachtung. Der CI für den gepoolten Datenmittelwert (alle neun Beobachtungen) beträgt , der nur auf dem Mittelwert basierende CI beträgt ( 39,7 ± 12,83 ) . Nicht sicher, was Ihr CI tut (Tippfehler? 17 nicht 27 und 51 nicht 61?), Ich erhalte 2,98 für Standardfehler von drei Mitteln und 4,30 als 0,975 Quantil von T dist mit 2 df. Ich würde denken, dass das CI, das Sie suchen, irgendwo zwischen diesen beiden liegt - da Sie partielles Pooling haben. Könnte auch in der Varianzformel V ( Y ) = E [ V ( Y(39.7±2.13)(39.7±12.83)2.984.300.975 jedes CI die Hälfte der FormelV(Y)=E[V(Y|Yg)]+V[E(Y|Yg)]
Wahrscheinlichkeitslogik
2
@probabilityislogic: Das SEM der drei experimentellen Mittelwerte beträgt 5,168 (nicht 2,98, wie Sie geschrieben haben), und das Konfidenzintervall, das ich im ursprünglichen Beitrag (17,4 bis 61,9) angegeben habe, ist korrekt. Das SEM wird aus der SD (8,95) durch Division durch die Quadratwurzel von n (Quadratwurzel von 3) berechnet. Sie haben stattdessen durch n (3) geteilt.
Harvey Motulsky
Mein Fehler, sollte auch durch 6.40 im gepoolten Intervall ersetzen (gleicher Fehler dort)2.136.40
Wahrscheinlichkeit
antwortet der folgende Link darauf? talkstats.com/showthread.php/11554-mean-of-means
@TST, Es scheint nur einen Link zu Wikipedia über gepoolte Varianz zu geben . Möchten Sie näher darauf eingehen?
Chl

Antworten:

6

Es gibt einen natürlichen genauen Konfidenzintervall für die grandmean in dem symmetrischen Zufall Einweg-ANOVA - Modell Tatsächlich ist es leichtzu überprüfendass die Verteilung der beobachteten Mittel ˉ y i ist ˉ y i ~ iid N ( μ , τ 2 ) mit & tgr; 2 = σ 2 b + σ 2 w

(yijμi)iidN(μich,σw2),j=1,,J,μichiidN(μ,σb2),ich=1,,ich.
y¯ichy¯ichiidN(μ,τ2) , und es ist bekanntdass die Summe der Quadrate zwischenSSBhat VerteilungSSB~Jτ2χ 2 I - 1 und ist unabhängig von der Gesamt beobachtet mittleren ˉ y~N(μ,τ2τ2=σb2+σw2JSSb
SSbJτ2χich-12
. Also ˉ y -μ
y¯N(μ,τ2ich)
hat eine Studentt -Verteilung mitI-1Freiheitsgraden, woraus sich leicht ein genaues Konfidenzintervall umμergibt.
y¯-μ1ichSSbJ(ich-1)
tich-1μ

Beachten Sie, dass dieses Konfidenzintervall nichts anderes als das klassische Intervall für einen Gaußschen Mittelwert ist, indem Sie nur das Gruppenmittel als die Beobachtungen betrachteny¯ich . So der einfache Ansatz, den Sie erwähnen:

Der einfache Ansatz besteht darin, zuerst den Mittelwert jedes Experiments zu berechnen: 38,0, 49,3 und 31,7, und dann den Mittelwert und das 95% -Konfidenzintervall dieser drei Werte zu berechnen. Mit dieser Methode ergibt sich ein Mittelwert von 39,7, wobei das 95% -Konfidenzintervall zwischen 17,4 und 61,9 liegt.

ist richtig. Und deine Intuition über die ignorierte Variante:

Das Problem bei diesem Ansatz besteht darin, dass die Variation zwischen den Dreifachwerten völlig ignoriert wird. Ich frage mich, ob es keinen guten Weg gibt, diese Variation zu erklären.

ist falsch. Ich erwähne auch die Richtigkeit einer solchen Vereinfachung in /stats//a/72578/8402

Update 12/04/2014

Einige Details sind jetzt in meinem Blog geschrieben: Reduzieren eines Modells, um Konfidenzintervalle zu erhalten .

Stéphane Laurent
quelle
Hilfe bei der Implementierung dieser Lösung in Python? stackoverflow.com/questions/45682437/…
blehman
7

Dies ist eine Frage der Schätzung innerhalb eines linearen Mischeffektmodells. Das Problem ist, dass die Varianz des Mittelwerts eine gewichtete Summe von zwei Varianzkomponenten ist, die separat geschätzt werden müssen (über eine ANOVA der Daten). Die Schätzungen haben unterschiedliche Freiheitsgrade. Obwohl man versuchen kann, ein Konfidenzintervall für den Mittelwert unter Verwendung der üblichen kleinen Stichprobenformeln (Student t) zu konstruieren, ist es daher unwahrscheinlich, dass seine nominelle Abdeckung erreicht wird, da die Abweichungen vom Mittelwert nicht genau einer Student t-Verteilung folgen.

In einem kürzlich erschienenen Artikel (2010) von Eva Jarosova, Schätzung mit dem linearen Mixed-Effects-Modell , wird dieses Problem erörtert. (Ab 2015 scheint es nicht mehr im Web verfügbar zu sein.) Im Kontext eines "kleinen" Datensatzes (der jedoch etwa dreimal so groß ist wie dieser) verwendet sie die Simulation, um zwei ungefähre CI-Berechnungen (das Bohrloch) auszuwerten -bekannte Satterthwaite-Approximation und die "Kenward-Roger-Methode"). Ihre Schlussfolgerungen sind

Eine Simulationsstudie ergab, dass die Qualität der Schätzung von Kovarianzparametern und folglich die Anpassung von Konfidenzintervallen in kleinen Stichproben sehr schlecht sein kann. Eine schlechte Schätzung kann nicht nur das wahre Konfidenzniveau herkömmlicher Intervalle beeinflussen, sondern auch die Anpassung unmöglich machen. Es ist offensichtlich, dass sich drei Arten von Intervallen [herkömmlich, Satterthwaite, KR] auch für ausgeglichene Daten erheblich unterscheiden können. Wenn ein auffälliger Unterschied zwischen dem herkömmlichen und dem eingestellten Intervall beobachtet wird, sollten Standardfehler der Kovarianzparameterschätzungen überprüft werden. Wenn andererseits die Unterschiede zwischen [den drei] Intervalltypen gering sind, scheint die Anpassung unnötig zu sein.

Kurz gesagt, scheint ein guter Ansatz zu sein

  1. Berechnen Sie ein herkömmliches CI, indem Sie die Schätzungen der Varianzkomponenten verwenden und so tun, als ob eine t-Verteilung zutrifft.

  2. Berechnen Sie auch mindestens eines der angepassten CIs.

  3. Wenn die Berechnungen "nah" sind, akzeptieren Sie die herkömmliche CI. Andernfalls melden Sie, dass nicht genügend Daten vorhanden sind, um ein zuverlässiges CI zu erstellen.

whuber
quelle
Die Verwendung der Varianzkomponenten führt zu demselben Konfidenzintervall, das ich im ursprünglichen Beitrag berechnet habe. Die ANOVA-Tabelle hat eine SS zwischen den Spalten von 480,7 mit 2 df, was bedeutet, dass die MS 240,3 beträgt. Die SD ist sqrt (MSbetween / n) = sqrt (240,3 / 3) = 8,95, was zu demselben CI führt, das ich ursprünglich gebucht habe (17,4 bis 61,9). Ich fand es sehr schwierig, dem von Ihnen zitierten Jarasova-Papier zu folgen, und bin mir nicht ganz sicher, ob es hier relevant ist (es scheint sich um Entwürfe für wiederholte Maßnahmen zu handeln). ???
Harvey Motulsky
@ Harvey Deine Beschreibung klingt für mich sicher nach wiederholten Maßnahmen! Ich glaube, das Jarasova-Papier ist genau richtig.
Whuber
1
Ich denke an die übliche Situation in Labors, in denen es sich bei den Dreifachversuchen lediglich um drei verschiedene Teströhrchen (oder Wells) handelt. Die in der Tabelle angegebene Reihenfolge der drei ist beliebig. Es gibt keine Verbindung oder Korrelation zwischen Replikat Nr. 2 im ersten Experiment und Replikat Nr. 2 im zweiten oder dritten Experiment. Jedes Experiment hat nur drei Messungen. Also nicht wirklich wiederholte Maßnahmen. Recht?
Harvey Motulsky
Überhaupt gibt es hier eine genaue Studentenverteilung. Siehe meine Antwort.
Stéphane Laurent
@Wenn der Link, den Sie für Eva Jarasovas Artikel angeben, nicht mehr vorhanden ist und eine Google-Suche nichts ergab. Können Sie den Verweis korrigieren?
Placidia
0

Es kann kein Konfidenzintervall geben, das beide Probleme löst. Sie müssen eine auswählen. Sie können einen aus einem mittleren Quadratfehlerterm innerhalb der experimentellen Varianz ableiten, der es Ihnen ermöglicht, etwas darüber zu sagen, wie genau Sie die Werte innerhalb des Experiments schätzen können, oder Sie können es zwischen zwei Experimenten tun. Wenn ich nur den ersteren gemacht hätte, würde ich ihn eher um 0 als um den großen Mittelwert zeichnen wollen, weil er nichts über den tatsächlichen Mittelwert aussagt, nur über einen Effekt (in diesem Fall 0). Oder Sie können einfach beides zeichnen und beschreiben, was sie tun.

Sie haben die Zwischenzeit im Griff. Für das Innere ist es wie das Berechnen des Fehlerausdrucks in einer ANOVA, um eine MSE zum Arbeiten zu bringen, und von dort ist die SE für das CI nur sqrt (MSE / n) (in diesem Fall n = 3).

John
quelle
Tatsächlich können Sie für jeden Mittelwert und für den Gesamtmittelwert ein glaubwürdiges Intervall festlegen. Verwenden Sie einfach ein Bayes'sches Mehrebenenmodell. Manchmal wird diese Art der Schätzung als partielles Pooling bezeichnet. Das Problem ist, glaube ich, die kleine Stichprobe.
Manoel Galdino
Sie könnten ein Konfidenzintervall für jeden Mittelwert und auch für den großen Mittelwert festlegen ... aber es sind verschiedene Dinge ... genau wie die glaubwürdigen Intervalle. Ich habe die Frage so interpretiert, dass es sich um CIs in Bezug auf die Varianz innerhalb der Studie und das Dazwischen als Aggregat handelt. Das alles lässt dich immer noch mit unterschiedlichen CIs zurück, die unterschiedliche Dinge bedeuten. (Ich habe das n auch nicht wörtlich genommen)
John
1
Außerdem ist die Art und Weise, wie ich sie meinte, nicht wirklich "nicht". Sie könnten sich irgendwie eine einzige Gleichung ausdenken, die ein Konfidenzintervall für alles berechnet. Es würde einfach nichts Sinnvolles bedeuten. Das ist, wofür ich gedacht habe, kann nicht.
John
Ein paar Minuten nachdem ich meinen Kommentar geschrieben hatte, wurde mir klar, dass wir das n nicht wörtlich nehmen sollten. Aber es war zu spät, um es zu bearbeiten =).
Manoel Galdino
0

Ich denke, das CI für den großen Mittelwert ist zu weit [17,62], selbst für den Bereich der Originaldaten.

Diese Experimente sind in der Chemie SEHR verbreitet. Bei der Zertifizierung von Referenzmaterialien müssen Sie beispielsweise einige Flaschen zufällig aus der gesamten Partie entnehmen und für jede Flasche eine Replikationsanalyse durchführen. Wie berechnen Sie den Referenzwert und seine Unsicherheit? Es gibt viele Möglichkeiten, dies zu tun, aber die ausgefeilteste (und meiner Meinung nach richtige) Methode ist die Anwendung von Metaanalysen oder ML (Dersimonian-Laird, Vangel-Rukhin usw.).

Was ist mit Bootstrap-Schätzungen?

auslöschen
quelle
1
Die Simulation (10.000 Versuche mit normalverteilten Haupteffekten und Fehlern) zeigt, dass [21, 58] ein symmetrischer zweiseitiger 95% -KI für den Mittelwert ist.
Whuber
whuber: Ich wäre gespannt, wie Sie diese Simulationen gemacht haben. Bootstrapping von den Originaldaten? Oder wirklich Simulationen? Wenn dies der Fall ist, welchen Mittelwert und welche SD-Werte haben Sie verwendet, um Daten zu simulieren?
Harvey Motulsky