Ich habe diesen Satz oft gehört, aber nie ganz verstanden, was er bedeutet. Der Ausdruck "gute frequentistische Eigenschaften" hat derzeit ~ 2750 Treffer bei Google, 536 auf scholar.google.com und 4 auf stats.stackexchange.com .
Die letzte Folie in dieser Präsentation der Stanford University , in der es heißt, kommt einer klaren Definition am nächsten
[D] Die Bedeutung der Meldung von 95% -Konfidenzintervallen besteht darin, dass Sie den wahren Parameter in 95% der von Ihnen gemachten Behauptungen "einfangen", selbst über verschiedene Schätzungsprobleme hinweg. Dies ist das bestimmende Merkmal von Schätzverfahren mit guten frequentistischen Eigenschaften: Sie halten bei wiederholter Anwendung der Prüfung stand.
Wenn ich etwas darüber nachdenke, gehe ich davon aus, dass der Ausdruck "gute frequentistische Eigenschaften" eine Einschätzung einer Bayes'schen Methode und insbesondere einer Bayes'schen Methode zur Intervallkonstruktion impliziert. Ich verstehe, dass Bayes'sche Intervalle den wahren Wert des Parameters mit der Wahrscheinlichkeit . Frequentistische Intervalle sollen so konstruiert sein, dass, wenn der Prozess der Intervallkonstruktion viele Male wiederholt wurde, etwa p ∗ 100 %
Ist das richtig? Ich denke, dass es mehr als das geben muss, da der Ausdruck sich eher auf gute frequentistische Eigenschaften bezieht , als auf gute frequentistische Eigenschaften .
quelle
Antworten:
Eine heikle Sache bei guten frequentistischen Eigenschaften ist, dass sie eher Eigenschaften einer Prozedur als Eigenschaften eines bestimmten Ergebnisses oder einer bestimmten Folgerung sind. Ein gutes frequentistisches Verfahren führt auf lange Sicht zu korrekten Rückschlüssen auf den angegebenen Anteil der Fälle, ein gutes bayesianisches Verfahren ist jedoch häufig dasjenige, das im jeweiligen Einzelfall zu korrekten Rückschlüssen führt.
Betrachten Sie beispielsweise ein Bayes'sches Verfahren, das im Allgemeinen "gut" ist, da es eine hintere Wahrscheinlichkeitsverteilung oder ein glaubwürdiges Intervall liefert, das die Kombination der Evidenz (Wahrscheinlichkeitsfunktion) mit der vorherigen Wahrscheinlichkeitsverteilung korrekt darstellt. Wenn der Prior genaue Informationen enthält (z. B. keine leere Meinung oder irgendeine Form von nicht informativem Prior), kann dieser Posterior oder dieses Intervall zu einer besseren Schlussfolgerung führen als ein frequentistisches Ergebnis aus denselben Daten. Besser im Sinne eines genaueren Rückschlusses auf diesen speziellen Fall oder eines engeren Schätzintervalls, da das Verfahren einen benutzerdefinierten Vorgänger verwendet, der genaue Informationen enthält. Auf lange Sicht wird der Erfassungsprozentsatz der Intervalle und die Richtigkeit der Schlussfolgerungen von der Qualität der einzelnen Prioritäten beeinflusst.
Beachten Sie, dass im Verfahren nicht festgelegt ist, wie der Prior bezogen werden soll, und die langfristige Leistungsabrechnung daher vermutlich einen früheren als einen für den jeweiligen Fall maßgeschneiderten Prior voraussetzt.
Ein Bayes'sches Verfahren kann gute frequentistische Eigenschaften haben. In vielen Fällen hat beispielsweise ein Bayes-Verfahren mit einem von einem Rezept bereitgestellten nicht informativen Prior ziemlich gute bis ausgezeichnete frequentistische Eigenschaften. Diese guten Eigenschaften wären eher ein Zufall als ein Konstruktionsmerkmal und eine direkte Folge eines solchen Verfahrens, das ähnliche Intervalle wie die häufig vorkommenden Verfahren ergibt.
Somit kann ein Bayes'sches Verfahren in einem einzelnen Experiment überlegene Inferenzeigenschaften aufweisen, während es auf lange Sicht schlechte Frequenzeigenschaften aufweist. Ebenso haben häufig vorkommende Verfahren mit guten Eigenschaften für häufig vorkommende Langzeitversuche bei einzelnen Experimenten oft eine schlechte Leistung.
quelle
Ich würde antworten, dass Ihre Analyse korrekt ist. Um ein paar weitere Einblicke zu geben, würde ich passende Prioritäten erwähnen.
Passende Priors sind in der Regel Priors, die für den Bau von Bayes'schen Modellen mit einer frequentistischen Eigenschaft konzipiert sind. Insbesondere sind sie so definiert, dass die erhaltenen HPD-Intervalle die häufigste Abdeckung des Konfidenzintervalls erfüllen (so dass 95% der 95% -HPD auf lange Sicht die wahren Werte enthalten). Beachten Sie, dass es in 1d analytische Lösungen gibt: Die Jeffreys-Priors stimmen mit den Priors überein. In höheren Dimensionen ist dies nicht notwendig (meines Wissens gibt es keinen Beweis dafür, dass dies niemals der Fall ist).
In der Praxis wird dieses Übereinstimmungsprinzip manchmal auch angewendet, um den Wert einiger Parameter eines Modells abzustimmen: Grundwahrheitsdaten werden verwendet, um diese Parameter in dem Sinne zu optimieren, dass ihre Werte die häufigste Abdeckung der resultierenden glaubwürdigen Intervalle für den interessierenden Parameter maximieren . Nach meinen eigenen Erfahrungen kann dies eine sehr subtile Aufgabe sein.
quelle
Nun zur Beantwortung Ihrer Frage: Nein, dies impliziert keine Bewertung der Bayes'schen Methode. Überspringen der Nuancen und Fokussieren des Schätzverfahrens, um es einfach zu halten: Der Häufigste in der Statistik ist die Idee, eine unbekannte feste Größe zu schätzen oder eine Hypothese zu testen und ein solches Verfahren anhand einer hypothetischen Wiederholung zu bewerten. Sie können viele Kriterien festlegen, um eine Prozedur zu bewerten. Was es zu einem frequentistischen Kriterium macht, ist, dass man sich Gedanken darüber macht, was passiert, wenn man immer wieder dasselbe Verfahren anwendet. Wenn Sie dies tun, interessieren Sie sich für die frequentistischen Eigenschaften. Mit anderen Worten: "Was sind die frequentistischen Eigenschaften?" bedeutet "Was passiert, wenn wir den Vorgang immer wieder wiederholen?" Nun, was macht solche frequentistischen Eigenschaften gutist eine weitere Ebene von Kriterien. Die häufigsten Frequentist-Eigenschaften, die als gute Eigenschaften angesehen werden, sind Konsistenz (bei einer Schätzung konvergiert der Schätzer bei fortgesetzter Abtastung gegen den von Ihnen geschätzten festen Wert), Effizienz (bei fortgesetzter Abtastung geht die Varianz des Schätzers gegen Null , so werden Sie immer genauer sein), Deckungswahrscheinlichkeit(In vielen Wiederholungen des Verfahrens enthält ein 95% -Konfidenzintervall in 95% der Fälle den wahren Wert). Die ersten beiden Eigenschaften werden als Eigenschaften für große Stichproben bezeichnet, die dritte Eigenschaft ist die von Neyman wirklich häufig vorkommende Eigenschaft in dem Sinne, dass nicht unbedingt asymptotische Ergebnisse verwendet werden müssen. Insgesamt gibt es also im Rahmen des Frequentismus einen wahren und unbekannten Wert. Sie schätzen es und Sie sind immer (außer bei einem seltenen Glücksfall) falsch in der Schätzung, aber Sie versuchen, sich zu retten, indem Sie verlangen, dass Sie zumindest bei einer hypothetisch unbegrenzten Wiederholung Ihrer Schätzung immer weniger falsch liegen oderSie wissen, dass Sie einige Male Recht hätten. Ich werde nicht diskutieren, ob es sinnvoll ist oder nicht, oder die zusätzlichen Annahmen, die erforderlich sind, um es zu rechtfertigen, da es nicht Ihre Fragen waren. Konzeptionell ist das, worauf sich frequentistische Eigenschaften beziehen und was gut in einem solchen Kontext im Allgemeinen bedeutet.
Abschließend zeige ich Ihnen dieses Papier, damit Sie selbst beurteilen können, ob es sinnvoll ist und was es bedeutet, dass ein Bayes-Verfahren gute frequentistische Eigenschaften aufweist (dort finden Sie weitere Referenzen):
quelle