Gleich oder anders? Der Bayes'sche Weg

10

Angenommen, ich habe das folgende Modell:

Poisson(λ){λ1if t<τλ2if tτ

Und ich schließe die unten gezeigten Posterioren für und aus meinen Daten ab. Gibt es einen Bayes - Weg (oder Quantifizierung) , wenn zu sagen und das sind gleich oder verschieden ?λ1λ2λ1λ2

Vielleicht die Wahrscheinlichkeitλ1λ2 messen, dass sich von ? Oder vielleicht KL-Divergenzen verwenden?

Wie kann ich beispielsweise oder zumindest messen ?p(λ2λ1)p(λ2>λ1)

Was ist im Allgemeinen eine gute Möglichkeit, diese Frage zu beantworten , wenn Sie die unten gezeigten Posterioren haben ( für beide überall PDF-Werte ungleich Null annehmen )?

Geben Sie hier die Bildbeschreibung ein

Aktualisieren

Es scheint, dass diese Frage auf zwei Arten beantwortet werden kann:

  1. Wenn wir Proben der Posterioren haben, könnten wir uns den Bruchteil der Proben ansehen, bei denen (oder gleichwertig ). @ Cam.Davidson.Pilon enthielt eine Antwort, die dieses Problem mithilfe solcher Beispiele beheben würde.λ1λ2λ2>λ1

  2. Integration eines Unterschieds der Posterioren. Und das ist ein wichtiger Teil meiner Frage. Wie würde diese Integration aussehen? Vermutlich würde sich der Stichprobenansatz diesem Integral annähern, aber ich würde gerne die Formulierung dieses Integrals kennen.

Hinweis: Die obigen Darstellungen stammen aus diesem Material .

Amelio Vazquez-Reina
quelle
Sie können einfach die Varianz beider Verteilungen berechnen und hinzufügen. Das ist die Varianz des Unterschieds in den Mitteln. Berechnen Sie dann die Differenz der Mittelwerte und sehen Sie, wie viele Standardabweichungen es sind. Sie können beide Verteilungen mit Normal approximieren, um zu beginnen, und die üblichen Konfidenzintervalle für eine Normalverteilung verwenden. Sie sind eindeutig unterschiedliche Mittel.
Dave31415
2
Intrinsische Hypothesentests sind eine Antwort
Stéphane Laurent
3
Alle erforderlichen Berechnungen sind in meiner Arbeit enthalten, aber ich habe den Fall von nicht untersucht ( ist das Verhältnis der beiden Poisson-Raten)H0:{ϕ=1}ϕ
Stéphane Laurent
Danke @ StéphaneLaurent. Ihr Papier ist ein guter Hinweis, aber es scheint spezifisch für Poisson-Prozesse zu sein. Was ist der Vergleich auf hoher Ebene, den ein Bayesianer durchführen kann, um abzuschätzen, ob gleich oder verschieden von ? Muss die Analyse verteilungsspezifisch sein? λ2λ1
Amelio Vazquez-Reina
2
Sorry @ user023472 Ich habe heutzutage keine Energie. Siehe Bernardos Papiere, die in meinem Papier zitiert sind. "Eigen" bedeutet, dass die Methode vom und nur vom Modell abgeleitet wird.
Stéphane Laurent

Antworten:

6

Ich denke, eine bessere Frage ist, sind sie signifikant unterschiedlich?

Um dies zu beantworten, müssen wir berechnen . Nennen Sie diese Menge . Wenn , besteht die gleiche Chance, dass einer größer als der andere ist. Wenn andererseits wirklich nahe bei 1 liegt, können wir sicher sein, dass yes größer (sprich: anders) als .P(λ2>λ1)pp0.50pλ2λ1

Wie berechnen wir ? In einem Bayesian MCMC-Framework ist dies trivial. Wir haben Samples aus dem posterioren Bereich. Berechnen wir also einfach die Wahrscheinlichkeit, dass Samples aus größer als :pλ2λ1

 p = np.mean( lambda_2_samples > lambda_1_samples )
 print p

Ich entschuldige mich dafür, dass ich dies nicht in das Buch aufgenommen habe. Ich werde es definitiv hinzufügen, da ich denke, dass es eine der nützlichsten Ideen in der Bayes'schen Folgerung ist

Cam.Davidson.Pilon
quelle
5
Die Wahrscheinlichkeit ist 1,0, sie sind unterschiedlich, da beide kontinuierliche Zufallsvariablen sind. Bedenken Sie: Was ist Ihre vorherige Vermutung, dass ? Glaubst du wirklich, dass sie tatsächlich gleich sind? (Ignorieren Sie das Testen von Hypothesen: Wir leben in der realen Welt, in der Variablen niemals gleich sind.) Siehe diesen Beitrag von meinem Helden Gelman. Computergestützt können Sie dies durch Rechnen testen . λ1=λ2np.mean( lambda_2_samples != lambda_1_samples)
Cam.Davidson.Pilon
1
Sie können definieren, wie wichtig "ungleich" ist. Wenn in Ihrem Beispiel beispielsweise ein Unterschied von weniger als eins praktisch nicht aussagekräftig ist, können Sie sich ansehen, und dies würde Ihnen eine aussagekräftige Statistik fürP(|λ1λ2|>1)P(λ1λ2)
Sam Dickson
3
Um meinen vorherigen Kommentar zu ergänzen: Wenn die Variablen und diskret waren, besteht die Möglichkeit, dass = . λ1λ2λ2λ1
Cam.Davidson.Pilon
1
Oh Gott, ich würde es hassen, in dieser Situation zu sein! Es geht um böse Integrale. Bei den meisten Modellen können Sie die Posterioren nicht ableiten. Selbst wenn Sie könnten, könnte es immer noch besser sein, einen Computer zu verwenden, nur um Proben zu erhalten. Zusammenfassend Beispiele> Formeln für Berechnungen wie diese.
Cam.Davidson.Pilon
2
Sie messen nicht "ausreichend größer". Betrachten Sie eine Verteilung mit einem Peak bei Null und eine andere mit gleichen Massen bei Peaks -10, 10. Ihre Statistik - der erwartete Wert des Indikators, dass eine Probe größer als die andere ist - ergibt 0,5, aber die Verteilungen sind eindeutig völlig unterschiedlich.
Neil G
5

Wie bereits erwähnt, ist diese Frage trivial. Angenommen, und sind kontinuierliche Zufallsvariablen, .λ1λ2Pr(λ1=λ2)=0

Ich vermute, Sie interessieren sich für die Wahrscheinlichkeit, dass und innerhalb eines voneinander liegen. In diesem Fall ist der Bereich der Differenz der beiden hinteren Dichten im Intervall Ihre Antwort. Größere Überlappungswerte zeigen an, dass die beiden Seitenzähne ähnlicher sind.λ1λ2ϵ[ϵ/2,ϵ/2]

Wenn Sie lieber mit simulierten Ergebnissen arbeiten möchten (und für die meisten Probleme haben wir nicht den Luxus der Wahl), nehmen Sie einfach den Anteil der Ergebnisse, wobei als Annäherung.λ2>λ1

Sycorax sagt Reinstate Monica
quelle
Vielen Dank. In welcher Beziehung steht Ihre Antwort zu einigen der Ideen, die in den Kommentaren des OP erörtert wurden?
Amelio Vazquez-Reina
Entschuldigung, aber ich bin mit keiner dieser Methoden vertraut, daher kann ich keinen aussagekräftigen Kommentar abgeben. @ Stéphane_Laurent ist allerdings ziemlich schlau, daher würde ich empfehlen, zumindest den Link durchzusehen.
Sycorax sagt Reinstate Monica
1
@ user023472 Entschuldigung, ich habe heute nicht die Energie, eine Antwort auf den Ansatz der intrinsischen Diskrepanz zu geben. Es basiert auf der Kullback-Leibler-Divergenz.
Stéphane Laurent
@ user777 Dies erfordert das Reparieren von . Was ist, wenn ich nur die Wahrscheinlichkeit oder sehen möchte ? ϵp(λ2>λ1)p(λ2λ1)
Amelio Vazquez-Reina
Danke @ user777. Ich interessiere mich für den Fall, dass wir keinen Zugang zu den Proben haben. Sie hatten früher ein Integral in Ihrem Beitrag, aber Sie scheinen es gelöscht zu haben. Wie würde dieses Integral aussehen?
Amelio Vazquez-Reina