Warum wird die Bayesianische Statistik zu einem immer beliebteren Forschungsthema? [geschlossen]

Beim Durchsuchen des Forschungsbereichs der 100 besten US-Nachrichtenstatistikprogramme sind fast alle von ihnen reich an Bayes'schen Statistiken. Wenn ich jedoch in eine weiterführende Schule gehe, betreiben die meisten von ihnen immer noch klassische / frequentistische Statistikforschung. Zum Beispiel hat meine derzeitige Schule (Rang 150 bis 200 in der QS-Weltrangliste für Statistiken, die nicht als Schule der Spitzenklasse angesehen werden) nur einen Professor, der sich auf Bayes'sche Statistiken konzentriert, und es gibt fast einen Groll gegen Bayes'sche Statistiken. Einige Studenten, mit denen ich gesprochen habe, sagen sogar, dass Bayesianische Statistiker Bayesianische Statistiken machen, was ich natürlich stark ablehne.

Ich frage mich jedoch, warum dies der Fall ist. Ich habe mehrere fundierte Vermutungen:

(a) Es gibt nicht genügend Raum für Fortschritte in der Methodik der klassischen / frequentierenden Statistiken, und die einzige tragfähige Forschung in der klassischen / frequentistischen Statistikforschung befasst sich mit Anwendungen, die im Mittelpunkt der Schule der unteren Klassen stehen werden, da die Schule der oberen Klasse mehr sein sollte Neigung zur theoretischen und methodischen Forschung.

(b) Es ist stark feldabhängig. Bestimmte Zweige von Statistiken sind einfach besser für Bayes'sche Statistiken geeignet, wie z. B. viele wissenschaftliche Anwendungen der Statistikmethode, während andere Zweige eher für klassische Statistiken wie den Finanzbereich geeignet sind. (Korrigieren Sie mich, wenn ich falsch liege.) Angesichts dessen scheint es mir, dass erstklassige Schulen viele Statistikfakultäten haben, die Anwendungen im wissenschaftlichen Bereich durchführen, während die Statistikabteilung der unteren Klassen hauptsächlich Anwendungen im Finanzbereich konzentriert, da dies ihnen hilft, Einkommen zu generieren und Finanzierung.

(c) Es gibt große Probleme mit der frequentistischen Methode, die nicht gelöst werden können, zum Beispiel die Neigung zur Überanpassung von MLE usw. Und Bayesian scheint brillante Lösungen zu bieten.

(d) Rechenleistung ist hier, daher ist die Bayes'sche Berechnung kein Engpass mehr wie vor 30 Jahren.

(e) Dies ist vielleicht die Meinung mit der größten Meinung, die ich habe. Es gibt einen Widerstand des klassischen / frequentistischen Statistikers, der eine neue Welle von Methoden, die möglicherweise die Rolle der klassischen Statistiken übernehmen kann, einfach nicht mag. Aber wie Larry Wasserman sagte, hängt es davon ab, was wir versuchen, und jeder sollte offen sein, insbesondere als Forscher.

bayesian frequentist Davidolohowski
quelle

Während die Meinungen der Lebenslaufbewohner unterschiedlich sein werden und eine solche Meinung als nicht zum Thema gehörend angesehen wird, sollte darauf hingewiesen werden, dass genau diese Frage in einleitenden Kapiteln moderner Texte zur Bayes'schen Analyse beantwortet wird. Insbesondere Kapitel 1 von Gelman et al., Bayesian Data Analysis 3rd Ed. Es läuft auf a) "gesunden Menschenverstand" und b) das äußerst problematische Konfidenzintervall der Frequentisten hinaus, das 99% von uns nur falsch interpretieren können. Die Art und Weise, wie wir es falsch interpretieren, ist an sich bayesianisch, daher können wir die Bayes'sche Analyse genauso gut von Anfang an durchführen.

Peter Leopold

@ Peter Leopold Halb ernst: 99%? und wer ist "wir"? Viele naive Benutzer von Statistiken haben in der Tat schwerwiegende Missverständnisse über CIs, aber wenn Sie sich an die CV-Community wenden, würde ich hoffen, dass 99% wirklich nicht passen. Statistische Personen können genauso schlecht sein wie alle anderen, wenn es darum geht, Zahlen zu ermitteln, wenn keine harten Daten vorliegen!

Nick Cox

@NickCox Ich habe mich an das OP gewandt, und das "Wir" soll einfühlsam und inklusiv sein. Hoffentlich wird "99%" als Größenordnungsschätzung erkannt . Es ist auch der größere Teil der Have / Have-Not- Trope in der Populärkultur, wo Have-Nots in diesem Zusammenhang auf das Ereignis hinweisen: "Ich habe Statistiken 101 genommen, aber ich habe die frequentistische vs. Bayes'sche Interpretation von Konfidenzintervallen nicht vollständig verinnerlicht gegen glaubwürdige Intervalle. " Und jetzt, wo Sie mich angerufen haben, werde ich behaupten (: D), dass es mein offizieller Prior für dieses Ereignis ist! Natürlich bin ich bereit, mich davon überzeugen zu lassen! : D

\sim 10^{- 2}

$\sim 10^{-2}$

Peter Leopold

Antworten:

Persönlich würde ich ein paar Vermutungen wagen:

(1) Die Bayes'sche Statistik verzeichnete in den letzten Jahrzehnten einen enormen Anstieg der Popularität. Ein Teil davon war auf Fortschritte bei MCMC und Verbesserungen bei den Rechenressourcen zurückzuführen. Die Bayes'schen Statistiken haben sich von theoretisch wirklich nett, aber nur für Spielzeugprobleme zu einem Ansatz entwickelt, der universeller angewendet werden könnte. Dies bedeutet, dass Sie vor einigen Jahren, als Sie sagten, Sie hätten an Bayes'schen Statistiken gearbeitet, wahrscheinlich zu einem sehr wettbewerbsfähigen Mitarbeiter geworden sind.

Jetzt würde ich sagen, dass die Bayes'sche Statistik immer noch ein Plus ist, aber auch an interessanten Problemen arbeitet, ohne Bayes'sche Methoden anzuwenden. Ein Mangel an Hintergrundinformationen in der Bayes'schen Statistik wäre für die meisten Einstellungsausschüsse sicherlich ein Minus, aber eine Promotion in Statistik ohne ausreichende Ausbildung in Bayes'schen Methoden wäre ziemlich überraschend.

(2) Bayesianische Statistiker werden in ihrem Lebenslauf "Bayesian" erwähnen. Frequentisten nehmen normalerweise nicht "Frequentist" in ihren Lebenslauf auf, sondern viel typischer den Bereich, in dem sie arbeiten (dh Überlebensanalyse, Vorhersagemodellierung, Prognose usw.). Ein Großteil meiner Arbeit besteht beispielsweise darin, Optimierungsalgorithmen zu schreiben. Ich würde vermuten, dass Sie sagen würden, dass ich häufig arbeite. Ich habe auch einiges an Bayes'schen Algorithmen geschrieben, aber es ist sicherlich in der Minderheit meiner Arbeit. Die Bayes'sche Statistik steht in meinem Lebenslauf, die Frequentist-Statistik nicht.

(3) In gewissem Maße gilt das, was Sie in Ihrer Frage gesagt haben, auch für die Wahrheit. Effiziente allgemeine Bayes'sche Berechnungen weisen offenere Probleme auf als der Bereich der Frequentisten. Beispielsweise ist der Hamiltonsche Monte Carlo in letzter Zeit zu einem sehr aufregenden Algorithmus für die generische Abtastung aus Bayes'schen Modellen geworden. Es gibt nicht viel Raum für Verbesserungen von GenerikaOptimierung in diesen Tagen; Newton Raphson-, L-BFGS- und EM-Algorithmen decken viele Grundlagen ab. Wenn Sie diese Methoden verbessern möchten, müssen Sie sich im Allgemeinen stark auf das Problem spezialisieren. Als solches sagen Sie eher "Ich arbeite an der hochdimensionalen Optimierung von georäumlichen Modellen" als "Ich arbeite an der hochdimensionalen Maximum-Likelihood-Schätzung". Die Welt des maschinellen Lernens ist eine Ausnahme, da es sehr aufregend ist, neue stochastische Optimierungsmethoden (z. B. SGD, Adam usw.) zu finden, aber das ist aus einigen Gründen ein etwas anderes Biest.

Ebenso muss daran gearbeitet werden, gute Prioritäten für Modelle zu finden. Frequentistischen Methoden zu tun haben ein Äquivalent dazu (kommt mit guten Strafen auf, dh LASSO, glmnet) , aber es gibt wahrscheinlich mehr fruchtbarer Boden für priors über Strafen.

(4) Schließlich, und dies ist definitiv eher eine persönliche Meinung, assoziieren viele Leute Frequentist mit p-Werten. Angesichts des allgemeinen Missbrauchs von p-Werten, der in anderen Bereichen beobachtet wird, würden sich viele Statistiker gerne so weit wie möglich von aktuellen Missbräuchen von p-Werten distanzieren.

Cliff AB
quelle

Die Antwort darauf, warum es populärer geworden ist, beinhaltet (1), dass es populärer geworden ist. Das ist verwirrt, aber ich stelle mir vor, es ist nur eine Frage der Umformulierung.

Nick Cox

@NickCox: Mein Punkt ist , dass es ist immer beliebter, aber auch wird sie die Popularität vielleicht etwas zu hoch angesetzt. Das heißt, das OP stellte fest, dass die Bayesianische Statistik im Lebenslauf fast aller Professoren einer Stichprobe von Spitzenuniversitäten enthalten war. Das heißt aber nicht, dass jeder dieser Professoren nur Bayes'sche Statistiken erstellt. Ein weiterer Punkt zu (1) war, dass es meiner Meinung nach eine Zeit gab, in der Bayes'sche Statistiken erstellt wurden, da Ihr Forschungsbereich sehr wichtig war, um eine Spitzenposition zu erreichen. Ich bin mir nicht sicher, ob dies eine so strenge Anforderung ist, aber viele der Professoren, die Sie jetzt sehen, wurden in dieser Zeit eingestellt.

Cliff AB

Oh, ich verstehe deinen Standpunkt. Ich konzentrierte mich auf die Diskussion über "Ist es, weil es nicht genug Raum für Fortschritte in der klassischen / frequentistischen Statistik gibt?" und nicht so sehr über das "Warum passiert das?"

Cliff AB