Beim Durchsuchen des Forschungsbereichs der 100 besten US-Nachrichtenstatistikprogramme sind fast alle von ihnen reich an Bayes'schen Statistiken. Wenn ich jedoch in eine weiterführende Schule gehe, betreiben die meisten von ihnen immer noch klassische / frequentistische Statistikforschung. Zum Beispiel hat meine derzeitige Schule (Rang 150 bis 200 in der QS-Weltrangliste für Statistiken, die nicht als Schule der Spitzenklasse angesehen werden) nur einen Professor, der sich auf Bayes'sche Statistiken konzentriert, und es gibt fast einen Groll gegen Bayes'sche Statistiken. Einige Studenten, mit denen ich gesprochen habe, sagen sogar, dass Bayesianische Statistiker Bayesianische Statistiken machen, was ich natürlich stark ablehne.
Ich frage mich jedoch, warum dies der Fall ist. Ich habe mehrere fundierte Vermutungen:
(a) Es gibt nicht genügend Raum für Fortschritte in der Methodik der klassischen / frequentierenden Statistiken, und die einzige tragfähige Forschung in der klassischen / frequentistischen Statistikforschung befasst sich mit Anwendungen, die im Mittelpunkt der Schule der unteren Klassen stehen werden, da die Schule der oberen Klasse mehr sein sollte Neigung zur theoretischen und methodischen Forschung.
(b) Es ist stark feldabhängig. Bestimmte Zweige von Statistiken sind einfach besser für Bayes'sche Statistiken geeignet, wie z. B. viele wissenschaftliche Anwendungen der Statistikmethode, während andere Zweige eher für klassische Statistiken wie den Finanzbereich geeignet sind. (Korrigieren Sie mich, wenn ich falsch liege.) Angesichts dessen scheint es mir, dass erstklassige Schulen viele Statistikfakultäten haben, die Anwendungen im wissenschaftlichen Bereich durchführen, während die Statistikabteilung der unteren Klassen hauptsächlich Anwendungen im Finanzbereich konzentriert, da dies ihnen hilft, Einkommen zu generieren und Finanzierung.
(c) Es gibt große Probleme mit der frequentistischen Methode, die nicht gelöst werden können, zum Beispiel die Neigung zur Überanpassung von MLE usw. Und Bayesian scheint brillante Lösungen zu bieten.
(d) Rechenleistung ist hier, daher ist die Bayes'sche Berechnung kein Engpass mehr wie vor 30 Jahren.
(e) Dies ist vielleicht die Meinung mit der größten Meinung, die ich habe. Es gibt einen Widerstand des klassischen / frequentistischen Statistikers, der eine neue Welle von Methoden, die möglicherweise die Rolle der klassischen Statistiken übernehmen kann, einfach nicht mag. Aber wie Larry Wasserman sagte, hängt es davon ab, was wir versuchen, und jeder sollte offen sein, insbesondere als Forscher.
quelle
Antworten:
Persönlich würde ich ein paar Vermutungen wagen:
(1) Die Bayes'sche Statistik verzeichnete in den letzten Jahrzehnten einen enormen Anstieg der Popularität. Ein Teil davon war auf Fortschritte bei MCMC und Verbesserungen bei den Rechenressourcen zurückzuführen. Die Bayes'schen Statistiken haben sich von theoretisch wirklich nett, aber nur für Spielzeugprobleme zu einem Ansatz entwickelt, der universeller angewendet werden könnte. Dies bedeutet, dass Sie vor einigen Jahren, als Sie sagten, Sie hätten an Bayes'schen Statistiken gearbeitet, wahrscheinlich zu einem sehr wettbewerbsfähigen Mitarbeiter geworden sind.
Jetzt würde ich sagen, dass die Bayes'sche Statistik immer noch ein Plus ist, aber auch an interessanten Problemen arbeitet, ohne Bayes'sche Methoden anzuwenden. Ein Mangel an Hintergrundinformationen in der Bayes'schen Statistik wäre für die meisten Einstellungsausschüsse sicherlich ein Minus, aber eine Promotion in Statistik ohne ausreichende Ausbildung in Bayes'schen Methoden wäre ziemlich überraschend.
(2) Bayesianische Statistiker werden in ihrem Lebenslauf "Bayesian" erwähnen. Frequentisten nehmen normalerweise nicht "Frequentist" in ihren Lebenslauf auf, sondern viel typischer den Bereich, in dem sie arbeiten (dh Überlebensanalyse, Vorhersagemodellierung, Prognose usw.). Ein Großteil meiner Arbeit besteht beispielsweise darin, Optimierungsalgorithmen zu schreiben. Ich würde vermuten, dass Sie sagen würden, dass ich häufig arbeite. Ich habe auch einiges an Bayes'schen Algorithmen geschrieben, aber es ist sicherlich in der Minderheit meiner Arbeit. Die Bayes'sche Statistik steht in meinem Lebenslauf, die Frequentist-Statistik nicht.
(3) In gewissem Maße gilt das, was Sie in Ihrer Frage gesagt haben, auch für die Wahrheit. Effiziente allgemeine Bayes'sche Berechnungen weisen offenere Probleme auf als der Bereich der Frequentisten. Beispielsweise ist der Hamiltonsche Monte Carlo in letzter Zeit zu einem sehr aufregenden Algorithmus für die generische Abtastung aus Bayes'schen Modellen geworden. Es gibt nicht viel Raum für Verbesserungen von GenerikaOptimierung in diesen Tagen; Newton Raphson-, L-BFGS- und EM-Algorithmen decken viele Grundlagen ab. Wenn Sie diese Methoden verbessern möchten, müssen Sie sich im Allgemeinen stark auf das Problem spezialisieren. Als solches sagen Sie eher "Ich arbeite an der hochdimensionalen Optimierung von georäumlichen Modellen" als "Ich arbeite an der hochdimensionalen Maximum-Likelihood-Schätzung". Die Welt des maschinellen Lernens ist eine Ausnahme, da es sehr aufregend ist, neue stochastische Optimierungsmethoden (z. B. SGD, Adam usw.) zu finden, aber das ist aus einigen Gründen ein etwas anderes Biest.
Ebenso muss daran gearbeitet werden, gute Prioritäten für Modelle zu finden. Frequentistischen Methoden zu tun haben ein Äquivalent dazu (kommt mit guten Strafen auf, dh LASSO, glmnet) , aber es gibt wahrscheinlich mehr fruchtbarer Boden für priors über Strafen.
(4) Schließlich, und dies ist definitiv eher eine persönliche Meinung, assoziieren viele Leute Frequentist mit p-Werten. Angesichts des allgemeinen Missbrauchs von p-Werten, der in anderen Bereichen beobachtet wird, würden sich viele Statistiker gerne so weit wie möglich von aktuellen Missbräuchen von p-Werten distanzieren.
quelle