Problem
Ich schreibe eine R-Funktion, die eine Bayes'sche Analyse durchführt, um eine posteriore Dichte bei einem informierten Prior und Daten zu schätzen. Ich möchte, dass die Funktion eine Warnung sendet, wenn der Benutzer den vorherigen überdenken muss.
In dieser Frage möchte ich lernen, wie man einen Prior bewertet. Frühere Fragen befassten sich mit der Mechanik der Angabe informierter Prioritäten ( hier und hier ).
In den folgenden Fällen muss der Prior möglicherweise neu bewertet werden:
- Die Daten stellen einen Extremfall dar, der bei der Angabe des Prior nicht berücksichtigt wurde
- Fehler in Daten (z. B. wenn Daten in Einheiten von g angegeben sind, wenn der Prior in kg angegeben ist)
- Aufgrund eines Fehlers im Code wurde aus einer Reihe verfügbarer Prioritäten der falsche Prior ausgewählt
Im ersten Fall sind die Prioritäten normalerweise noch so diffus, dass die Daten sie im Allgemeinen überwältigen, es sei denn, die Datenwerte liegen in einem nicht unterstützten Bereich (z. B. <0 für logN oder Gamma). Die anderen Fälle sind Fehler oder Irrtümer.
Fragen
- Gibt es Probleme hinsichtlich der Gültigkeit der Verwendung von Daten zur Bewertung eines Prior?
- Ist ein bestimmter Test für dieses Problem am besten geeignet?
Beispiele
Hier sind zwei Datensätze, die schlecht mit einem übereinstimmen, da sie aus Populationen mit entweder (rot) oder (blau) stammen.
Die blauen Daten könnten eine gültige Kombination aus Prior und Daten sein, während die roten Daten eine vorherige Verteilung erfordern würden, die für negative Werte unterstützt wird.
set.seed(1)
x<- seq(0.01,15,by=0.1)
plot(x, dlnorm(x), type = 'l', xlim = c(-15,15),xlab='',ylab='')
points(rnorm(50,0,5),jitter(rep(0,50),factor =0.2), cex = 0.3, col = 'red')
points(rnorm(50,8,0.5),jitter(rep(0,50),factor =0.4), cex = 0.3, col = 'blue')
quelle
Hier meine zwei Cent:
Ich denke, Sie sollten sich Gedanken über frühere Parameter machen, die mit Verhältnissen verbunden sind.
Sie sprechen über informative Prior, aber ich denke, Sie sollten Benutzer warnen, was ein vernünftiger nicht informativer Prior ist. Ich meine, manchmal ist ein Normalwert mit einem Mittelwert von Null und einer Varianz von 100 ziemlich uninformativ und manchmal informativ, abhängig von den verwendeten Skalen. Wenn Sie beispielsweise die Löhne in Höhen (Zentimetern) als die oben genannten zurückführen, ist dies sehr informativ. Wenn Sie jedoch die Protokolllöhne auf Höhen (Metern) zurückführen, ist der oben genannte Prior nicht so informativ.
Wenn Sie einen Prior verwenden, der ein Ergebnis einer vorherigen Analyse ist, dh der neue Prior ist tatsächlich ein alter Posteriori einer vorherigen Analyse, dann sind die Dinge anders. Ich gehe davon aus, dass dies der Fall ist.
quelle