Ich arbeite die Beispiele in Kruschkes Doing Bayesian Data Analysis durch , insbesondere die exponentielle Poisson-ANOVA in Kap. 22, die er als Alternative zu häufig auftretenden Chi-Quadrat-Unabhängigkeitstests für Kontingenztabellen vorstellt.
Ich kann sehen, wie wir Informationen über Interaktionen erhalten, die mehr oder weniger häufig auftreten als erwartet, wenn die Variablen unabhängig wären (dh wenn der HDI Null ausschließt).
Meine Frage ist, wie ich eine Effektgröße in diesem Framework berechnen oder interpretieren kann . Zum Beispiel schreibt Kruschke, "die Kombination von blauen Augen mit schwarzen Haaren kommt seltener vor, als es zu erwarten wäre, wenn Augenfarbe und Haarfarbe unabhängig wären", aber wie können wir die Stärke dieser Assoziation beschreiben? Wie kann ich feststellen, welche Interaktionen extremer sind als andere? Wenn wir einen Chi-Quadrat-Test dieser Daten durchführen würden, könnten wir das Cramér-V als Maß für die Gesamteffektgröße berechnen. Wie drücke ich die Effektgröße in diesem Bayes'schen Kontext aus?
Hier ist das in sich geschlossene Beispiel aus dem Buch (codiert in R
), für den Fall, dass die Antwort mir in aller Deutlichkeit verborgen bleibt ...
df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15,
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond",
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))
df
Blue Brown Green Hazel
Black 20 68 5 15
Blond 94 7 16 10
Brunette 84 119 29 54
Red 17 26 14 14
Hier ist die häufigere Ausgabe mit Maß für die Effektgröße (nicht im Buch enthalten):
vcd::assocstats(df)
X^2 df P(> X^2)
Likelihood Ratio 146.44 9 0
Pearson 138.29 9 0
Phi-Coefficient : 0.483
Contingency Coeff.: 0.435
Cramer's V : 0.279
Hier ist die Bayes'sche Ausgabe mit HDIs und Zellwahrscheinlichkeiten (direkt aus dem Buch):
# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
"http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R",
"http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")
# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))
# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))
Und hier sind Diagramme des hinteren Exponentialmodells von Poisson, die auf die Daten angewendet wurden:
Und Diagramme der posterioren Verteilung auf geschätzte Zellwahrscheinlichkeiten:
R
zu zeigen, wie es programmiert werden könnte?sd ()
Kombination mit einer der "Apply" -Funktionen verwenden können. Boxplots sind einfach zu handhabenboxplot ()
.