Hinweis: Ich bin bewusst , philosophischen Unterschiede zwischen Bayes und frequentistischen Statistiken.
Zum Beispiel: "Wie groß ist die Wahrscheinlichkeit, dass die Münze auf dem Tisch Kopf ist?" Ist in der Frequenzstatistik nicht sinnvoll, da entweder Kopf oder Zahl bereits gelandet sind - es gibt keine Wahrscheinlichkeit dafür. Die Frage ist also häufig unbeantwortet.
Aber ein solcher Unterschied ist nicht die Art von Unterschied, nach der ich frage.
Vielmehr würde ich gerne wissen, wie sie ihre Prognosen für wohlgeformte Fragen tatsächlich unterscheiden sich in der realen Welt, ohne jegliche theoretischen / philosophische Unterschiede wie das Beispiel , das ich oben erwähnt.
Also mit anderen Worten:
Was ist ein Beispiel für eine Frage, die sowohl in der frequentistischen als auch in der bayesianischen Statistik beantwortet werden kann und deren Antwort sich zwischen den beiden unterscheidet?
(ZB antwortet einer von ihnen auf eine bestimmte Frage mit "1/2" und der andere mit "2/3".)
Gibt es solche Unterschiede?
Wenn ja, welche Beispiele gibt es?
Wenn nicht, wann macht es dann überhaupt einen Unterschied, ob ich bei der Lösung eines bestimmten Problems Bayes'sche oder frequentistische Statistiken verwende?
Warum sollte ich eins für das andere vermeiden?
quelle
Antworten:
Dieses Beispiel stammt von hier . (Ich glaube sogar, ich habe diesen Link von SO erhalten, kann ihn aber nicht mehr finden.)
quelle
Siehe meine Frage hier , in der ein Artikel von Edwin Jaynes erwähnt wird, der ein Beispiel für ein korrekt konstruiertes Häufigkeitsintervall gibt, in dem die Stichprobe genügend Informationen enthält, um sicher zu sein, dass der wahre Wert der Statistik nirgendwo im Vertrauensintervall liegt ( und somit unterscheidet sich das Konfidenzintervall vom Bayes'schen glaubwürdigen Intervall.
Der Grund dafür ist jedoch die unterschiedliche Definition eines Konfidenzintervalls und eines glaubwürdigen Intervalls, was wiederum eine direkte Folge der unterschiedlichen Definitionen der Wahrscheinlichkeit nach Frequentist und Bayes ist. Wenn Sie einen Bayesianer bitten, ein Bayesianisches Konfidenzintervall (anstatt eines glaubwürdigen) zu erstellen, dann vermute ich, dass es immer ein Prior gibt, für das die Intervalle gleich sind, daher sind die Unterschiede auf die Wahl des Prior zurückzuführen.
Ob häufig verwendete oder bayesianische Methoden geeignet sind, hängt von der Frage ab, die Sie stellen möchten, und letztendlich entscheidet der Unterschied in der Philosophie über die Antwort (vorausgesetzt, der erforderliche Rechenaufwand und der Analyseaufwand spielen keine Rolle).
Man könnte argumentieren, dass eine Langzeithäufigkeit eine durchaus vernünftige Methode ist, um die relative Plausibilität eines Satzes zu bestimmen. In diesem Fall ist die frequentistische Statistik eine etwas merkwürdige Teilmenge des subjektiven Bayesianismus - also jede Frage, die ein Frequentist beantworten kann Ein subjektivistischer Bayesianer kann auch auf die gleiche Art und Weise antworten oder auf eine andere Art und Weise, falls er andere Prioritäten wählt. ;O)
quelle
Ich bin der Meinung, dass dieses Papier einen besseren Einblick in die Kompromisse zwischen den beiden Anwendungen bietet. Ein Teil davon könnte auf meine Vorliebe für Intervalle anstatt für Tests zurückzuführen sein.
In Bezug auf Intervalle kann es sinnvoll sein, zu berücksichtigen, dass häufig auftretende Konfidenzintervalle eine einheitliche Erfassung erfordern (genau oder mindestens größer als x% für jeden Parameterwert, der keine Nullwahrscheinlichkeit aufweist), und wenn nicht haben das - sie sind nicht wirklich Konfidenzintervalle. (Einige gehen noch weiter und sagen, dass sie auch relevante Teilmengen ausschließen müssen, die die Abdeckung verändern.)
Die Bayes'sche Berichterstattung wird normalerweise dadurch definiert, dass die "durchschnittliche Berichterstattung" verringert wird, wenn angenommen wird, dass die vorherige Berichterstattung genau korrekt ist. Gustafson und Greenland (2009) bezeichnen diese allmächtigen Prioritäten als fehlbar, um eine bessere Einschätzung zu ermöglichen.
quelle
Wenn jemand eine Frage stellen würde, die sowohl eine häufig gestellte als auch eine bayesianische Antwort hat, könnte meiner Meinung nach eine andere Person eine Mehrdeutigkeit in der Frage erkennen und sie daher nicht "gut geformt" machen.
Mit anderen Worten, wenn Sie eine häufig auftretende Antwort benötigen, wenden Sie häufig auftretende Methoden an. Wenn Sie eine Bayes'sche Antwort benötigen, wenden Sie die Bayes'schen Methoden an. Wenn Sie nicht wissen, welche Sie benötigen, haben Sie die Frage möglicherweise nicht eindeutig definiert.
In der realen Welt gibt es jedoch oft verschiedene Möglichkeiten, ein Problem zu definieren oder eine Frage zu stellen. Manchmal ist nicht klar, welcher dieser Wege vorzuziehen ist. Dies ist besonders dann der Fall, wenn der Kunde statistisch naiv ist. Manchmal ist eine Frage viel schwieriger zu beantworten als eine andere. In solchen Fällen versucht man oft am einfachsten sicherzustellen, dass seine Kunden genau mit der Frage einverstanden sind, die er stellt oder die er löst.
quelle
Ich empfehle, Übung 3.15 des frei verfügbaren Lehrbuchs Informationstheorie, Inferenz und Lernalgorithmen von MacKay zu lesen.
quelle