Problem: Ich parametrisiere Verteilungen zur Verwendung als Prioritäten und Daten in einer Bayes'schen Metaanalyse. Die Daten werden in der Literatur als zusammenfassende Statistiken bereitgestellt, von denen fast ausschließlich angenommen wird, dass sie normal verteilt sind (obwohl keine der Variablen <0 sein kann, einige Verhältnisse sind, andere Massen sind und usw.).
Ich bin auf zwei Fälle gestoßen, für die ich keine Lösung habe. Manchmal ist der interessierende Parameter die Inverse der Daten oder das Verhältnis zweier Variablen.
Beispiele:
- das Verhältnis zweier normalverteilter Variablen:
- Daten: Mittelwert und SD für Prozent Stickstoff und Prozent Kohlenstoff
- Parameter: Verhältnis von Kohlenstoff zu Stickstoff.
- die Umkehrung einer normalverteilten Variablen:
- Daten: Masse / Fläche
- Parameter: Fläche / Masse
Mein derzeitiger Ansatz ist die Verwendung der Simulation:
zB für einen Satz von Kohlenstoff- und Stickstoff-Prozentdaten mit Mittelwerten: xbar.n, c, Varianz: se.n, c und Probengröße: nn, nc:
set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N
Ich möchte ratio.cn = perc.c / perc.n parametrieren
# parameter of interest
ratio.cn <- perc.c / perc.n
Wählen Sie dann die am besten passenden Verteilungen mit dem Bereich für meinen Prior
library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}
Frage: Ist das ein gültiger Ansatz? Gibt es andere / bessere Ansätze?
Danke im Voraus!
Update: Die Cauchy-Verteilung, die als Verhältnis zweier Normalen mit , ist nur bedingt anwendbar, da ich die Varianz schätzen möchte. Vielleicht könnte ich die Varianz einer Simulation von n Zügen aus einem Cauchy berechnen?
Ich habe folgende geschlossene Form Annäherungen finden , aber ich habe nicht getestet , um zu sehen , ob sie die gleichen Ergebnisse geben ... Hayya et al, 1975 μ y : x = μ y / m u x + σ 2 x * μ y / μ 3 x + c o v ( x , y ) * σ 2 x * σσ 2 y : x
Hayya, J. und Armstrong, D. und Gressis, N., 1975. Eine Anmerkung zum Verhältnis zweier normalverteilter Variablen. Management Science 21: 1338-1341
quelle
Antworten:
Vielleicht möchten Sie sich einige der Referenzen im Wikipedia-Artikel zur Verhältnisverteilung ansehen . Möglicherweise finden Sie bessere Annäherungen oder Verteilungen. Ansonsten scheint Ihr Ansatz vernünftig.
Update Ich denke, eine bessere Referenz könnte sein:
Siehe Formeln 2-4 auf Seite 195.
Update 2
Zu Ihrer aktualisierten Frage bezüglich der Abweichung von einem Cauchy - wie John Cook in den Kommentaren hervorhob - gibt es keine Abweichung. Eine Stichprobenvarianz zu nehmen, funktioniert also einfach nicht als "Schätzer". In der Tat werden Sie feststellen, dass Ihre Stichprobenvarianz überhaupt nicht konvergiert und wild schwankt, wenn Sie weiter Stichproben nehmen.
quelle
Mein unten stehender Vorschlag, den Cauchy zu verwenden, funktioniert nicht, wie in den Kommentaren von Ars und John ausgeführt.
Das Verhältnis zweier normalerweise zufälliger Variablen folgt der Cauchy- Verteilung. Sie können diese Idee verwenden, um die Parameter des Cauchy zu identifizieren, die Ihren Daten am ehesten entsprechen.quelle