Ich würde gerne einige "Beispiele aus der Praxis" für den Unterricht in Bayes'scher Statistik finden. Die Bayes'sche Statistik ermöglicht es, Vorkenntnisse formal in eine Analyse einzubeziehen. Ich möchte den Studenten einige einfache Beispiele aus der Praxis von Forschern geben, die Vorkenntnisse in ihre Analyse einbeziehen, damit die Studenten die Motivation besser verstehen können, warum man Bayes'sche Statistiken überhaupt verwenden möchte.
Kennen Sie einfache Beispiele aus der Praxis wie die Schätzung eines Bevölkerungsmittels, eines Bevölkerungsanteils, einer Regression usw., bei denen Forscher Vorinformationen formell einbeziehen? Mir ist klar, dass Bayesianer auch "nicht informative" Prioritäten verwenden können, aber ich bin besonders an realen Beispielen interessiert, bei denen informative Prioritäten (dh echte vorherige Informationen) verwendet werden.
Antworten:
Die Bayes'sche Suchtheorie ist eine interessante reale Anwendung der Bayes'schen Statistik, die viele Male angewendet wurde, um nach verlorenen Schiffen auf See zu suchen. Zu Beginn wird eine Karte in Quadrate unterteilt. Jedem Quadrat wird eine vorherige Wahrscheinlichkeit zugewiesen, das verlorene Schiff zu enthalten, basierend auf der letzten bekannten Position, dem Kurs, der fehlenden Zeit, den Strömen usw. Zusätzlich wird jedem Quadrat eine bedingte Wahrscheinlichkeit zugewiesen, das Schiff zu finden, wenn es sich tatsächlich auf diesem Quadrat befindet, basierend auf Dinge wie Wassertiefe. Diese Verteilungen werden kombiniert, um Kartenquadrate zu priorisieren, die die höchste Wahrscheinlichkeit haben, ein positives Ergebnis zu erzielen. Dies ist nicht unbedingt der wahrscheinlichste Ort für das Schiff, sondern der wahrscheinlichste Ort, an dem das Schiff tatsächlich gefunden wird.
quelle
Ich denke, die Schätzung der Produktion oder der Populationsgröße anhand von Seriennummern ist interessant, wenn ein traditionelles Erklärungsbeispiel vorliegt. Hier versuchen Sie das Maximum einer diskreten Gleichverteilung. Abhängig von Ihrer Wahl des Vorgängers unterscheiden sich die maximale Wahrscheinlichkeit und die Bayes'schen Schätzungen auf ziemlich transparente Weise.
Das vielleicht berühmteste Beispiel ist die Schätzung der Produktionsrate deutscher Panzer während des Zweiten Weltkriegs anhand von Seriennummernbändern und Herstellercodes, die in der häufig vorkommenden Umgebung von (Ruggles and Brodie, 1947) erstellt wurden. Eine alternative Analyse aus Bayes-Sicht mit informativen Prioritäten wurde von (Downey, 2013) und mit unangemessenen, nicht informativen Prioritäten von (Höhle und Held, 2004) durchgeführt. Die Arbeit von (Höhle und Held, 2004) enthält auch viel mehr Verweise auf frühere Behandlungen in der Literatur, und es gibt auch mehr Diskussionen über dieses Problem auf dieser Seite.
Quellen:
Kapitel 3, Downey, Allen. Denken Sie an Bayes: Bayesianische Statistik in Python. "O'Reilly Media, Inc.", 2013.
Wikipedia
Ruggles, R.; Brodie, H. (1947). "Ein empirischer Ansatz zur wirtschaftlichen Intelligenz im Zweiten Weltkrieg". Zeitschrift der American Statistical Association. 42 (237): 72.
Höhle, Michael und Leonhard Held. Bayesianische Schätzung der Bevölkerungsgröße. Nr. 499. Diskussionspapier // Sonderforschungsbereich 386 der Ludwig-Maximilians-Universität München, 2006.
quelle
In Cressie & Wickle Statistics for Spatio-Temporal Data , Wiley, gibt es eine schöne Geschichte über die (bayesianische) Suche nach der USS Scorpion, einem U-Boot, das 1968 verloren gegangen ist. Wir erzählen diese Geschichte unseren Schülern und lassen sie eine ( vereinfachte) Suche mit einem Simulator .
Ähnliche Beispiele könnten um die Geschichte des verlorenen Fluges MH370 herum konstruiert werden; Vielleicht möchten Sie sich Davey et al., Bayesianische Methoden bei der Suche nach MH370 , Springer-Verlag , ansehen .
quelle
Oder wie typischer von Bayesian geschrieben,
Die posteriore Verteilung, die wir aus diesem Normal-Normal-Datenmodell (nach viel Algebra) erhalten, ist eine weitere Normalverteilung.
Sie können dies jetzt anhand eines beliebigen Lehrbuchbeispiels für normale Daten veranschaulichen. Ich werde den Datensatz
airquality
in R verwenden. Betrachten Sie das Problem der Schätzung der durchschnittlichen Windgeschwindigkeit (MPH).In dieser Analyse kann der Forscher (Sie) sagen, dass bei geschätzten Daten + vorherigen Informationen Ihre Schätzung des durchschnittlichen Windes unter Verwendung des 50. Perzentils 10.00324 betragen sollte, mehr als nur unter Verwendung des Durchschnitts aus den Daten. Sie erhalten auch eine vollständige Verteilung, aus der Sie mit den Quantilen 2,5 und 97,5 ein zu 95% glaubwürdiges Intervall extrahieren können.
Im Folgenden füge ich zwei Referenzen hinzu. Ich empfehle dringend, Casellas Kurzarbeit zu lesen. Es zielt speziell auf empirische Bayes-Methoden ab, erklärt jedoch die allgemeine Bayes'sche Methodik für normale Modelle.
Verweise:
Casella, G. (1985). Eine Einführung in die empirische Bayes-Datenanalyse. The American Statistician, 39 (2), 83-87.
Gelman, A. (2004). Bayesianische Datenanalyse (2. Aufl., Texte in der Statistikwissenschaft). Boca Raton, Fla.: Chapman & Hall / CRC.
quelle
Ein Forschungsbereich, in dem ich die Bayes'schen Methoden für absolut notwendig halte, ist das optimale Design.
quelle
Ich habe in letzter Zeit über diese Frage nachgedacht, und ich glaube, ich habe ein Beispiel, bei dem Bayesian sinnvoll ist, wobei eine vorherige Wahrscheinlichkeit verwendet wird: das Wahrscheinlichkeitsverhältnis eines klinischen Tests.
Das Beispiel könnte dieses sein: die Gültigkeit des Urin-Dipslides unter täglichen Übungsbedingungen (Family Practice 2003; 20: 410-2). Die Idee ist zu sehen, was ein positives Ergebnis des Urinabfalls für die Diagnose einer Urininfektion bedeutet. Das Wahrscheinlichkeitsverhältnis des positiven Ergebnisses ist:
Hier ist der Test gut, um die Infektion zu erkennen, aber nicht so gut, um die Infektion zu verwerfen.
quelle