Ich muss eine Art "Durchschnitt" aus einer Liste von Abweichungen ermitteln, habe aber Probleme, eine vernünftige Lösung zu finden. Es gibt eine interessante Diskussion über die Unterschiede zwischen den drei pythagoreischen Mitteln (arithmetisch, geometrisch und harmonisch) in diesem Thread ; Ich glaube jedoch immer noch nicht, dass einer von ihnen ein guter Kandidat wäre. Irgendwelche Vorschläge?
PS Ein gewisser Kontext - Diese Varianzen sind Stichprobenvarianzen von Probanden, von denen jeder denselben Versuchsaufbau mit ungefähr derselben Stichprobengröße durchlief . Mit anderen Worten, es gibt Stichprobenvarianzen , , ..., , die diesen Subjekten entsprechen. Auf Bevölkerungsebene wurde bereits eine Metaanalyse durchgeführt. Der Grund, warum ich eine Art "durchschnittliche" oder "zusammengefasste" Stichprobenvarianz erhalten muss, ist, dass ich damit einen Index wie ICC nach der Metaanalyse berechnen möchte .k n σ 2 1 σ 2 2 σ 2 n n
PPS Um die Diskussion konkreter zu halten, möchte ich das Problem anhand des folgenden Beispiels in R erläutern:
library(metafor)
dat <- get(data(dat.konstantopoulos2011))
dat$district <- as.factor(dat$district)
dat$school <- as.factor(dat$school)
Im Datensatz gibt es eine Varianz, die mit der Leistungsbewertung jeder Schule verknüpft ist:
str(dat)
Classes ‘escalc’ and 'data.frame': 56 obs. of 6 variables:
$ district: Factor w/ 11 levels "11","12","18",..: 1 1 1 1 2 2 2 2 3 3 ...
$ school : Factor w/ 11 levels "1","2","3","4",..: 1 2 3 4 1 2 3 4 1 2 ...
$ year : int 1976 1976 1976 1976 1989 1989 1989 1989 1994 1994 ...
$ yi : atomic -0.18 -0.22 0.23 -0.3 0.13 -0.26 0.19 0.32 0.45 0.38 ...
$ vi : num 0.118 0.118 0.144 0.144 0.014 0.014 0.015 0.024 0.023 0.043 ...
Angenommen, wir führen eine Metaanalyse mit einem hierarchischen Modell oder einem Modell mit gemischten Effekten durch:
Dabei sind und die zufälligen Effekte für die te Schule bzw. den ten Bezirk und der Messfehler mit einer bekannten Gaußschen Verteilung . Dieses Modell kann wie folgt analysiert werden:β j i j ϵ i j N ( 0 , v i j )
(fm <- rma.mv(yi, vi, random = list(~1 | district, ~1 | school), data=dat))
Rendern der folgenden Varianzschätzungen für die beiden Varianzkomponenten:
Multivariate Meta-Analysis Model (k = 56; method: REML)
Variance Components:
estim sqrt nlvls fixed factor
sigma^2.1 0.0814 0.2853 11 no district
sigma^2.2 0.0010 0.0308 11 no school
Die beiden Varianzen im Ergebnis, Sigma ^ 2.1 und Sigma ^ 2.2, entsprechen den beiden Variablen mit zufälligen Effekten (Bezirk und Schule).
Ich möchte den ICC für Distrikt berechnen, und deshalb wollte ich zunächst eine zusammengefasste Varianz für diese einzelnen Varianzen des . Da ist die Gesamtvarianz ϵ i j
Mein ursprünglicher (und einfacher) Ansatz bestand darin, nur das arithmetische Mittel zu verwenden:
Ich bin mir jedoch nicht sicher, ob das arithmetische Mittel in diesem Zusammenhang angemessen ist.
Antworten:
Wenn Sie die Kommentare erweitern, die Sie erhalten haben, finden Sie die Antwort auf die Frage in Ihrem Titel bereits unter Wie summiere ich eine Standardabweichung? Thread und lautet wie folgt: Um die durchschnittliche Standardabweichung zu erhalten, nehmen Sie zuerst den Durchschnitt der Varianzen und dann die Quadratwurzel daraus.
Beachten Sie, dass moderne Formulierungen von ICC es tatsächlich in Form von Modellen mit gemischten Effekten der oben beschriebenen Art definieren. Die Verwendung eines solchen Modells löst also mehrere Probleme für Sie und ist häufig der empfohlene Ansatz für die Metaanalyse (beachten Sie jedoch, dass ICC dies kann irreführend sein ).
In Bezug auf Ihre Bearbeitung, wenn Ihr Modell ist
Der Zähler in der ICC-Formel ist also die Varianz des interessierenden Effekts und der Nenner ist die Gesamtvarianz. Beachten Sie, dass der Mittelwert der Abweichungen nichts mit der Gesamtvarianz (Summe der Abweichungen) zu tun hat. Wenn ich also nichts falsch verstehe, kann ich nicht erkennen, warum der Mittelwert hier für Sie von Interesse ist.
quelle