Die Mathematik hat ihre berühmten Millenniumsprobleme (und historisch gesehen Hilberts 23 ), Fragen, die dazu beigetragen haben, die Richtung des Feldes zu bestimmen.
Ich habe jedoch keine Ahnung, wie die Riemann-Hypothesen und die P-gegen-NP-Werte der Statistik aussehen würden.
Also, was sind die übergreifenden offenen Fragen in der Statistik?
Bearbeitet, um hinzuzufügen: Als Beispiel für den allgemeinen Geist (wenn auch nicht ganz bestimmten) der Antwort, die ich suche, fand ich einen "Hilbert's 23" -inspirierten Vortrag von David Donoho auf einer "Math Challenges of the 21st Century" -Konferenz: Hochdimensionale Datenanalyse: Die Flüche und Segnungen der Dimensionalität
Eine mögliche Antwort könnte sich also auf Big Data und die Frage beziehen, warum dies wichtig ist, welche statistischen Herausforderungen hochdimensionale Daten darstellen und welche Methoden entwickelt oder welche Fragen beantwortet werden müssen, um das Problem zu lösen.
Antworten:
Eine große Frage sollte zentrale Fragen der statistischen Methodik betreffen oder, da es sich bei der Statistik ausschließlich um Anwendungen handelt, die Verwendung der Statistik bei Problemen, die für die Gesellschaft wichtig sind.
Diese Charakterisierung legt nahe, dass Folgendes bei jeder Betrachtung großer Probleme berücksichtigt werden sollte:
Wie man am besten Arzneimittelstudien durchführt . Derzeit erfordert das Testen klassischer Hypothesen viele formale Studienphasen. In späteren (konfirmatorischen) Phasen spielen die wirtschaftlichen und ethischen Fragen eine große Rolle. Können wir es besser machen? Müssen wir Hunderte oder Tausende Kranke in Kontrollgruppen einordnen und dort bis zum Ende einer Studie aufbewahren, oder können wir bessere Wege finden, um wirklich wirksame Behandlungen zu identifizieren und sie den Mitgliedern der Studie zu verabreichen (und andere) früher?
Umgang mit wissenschaftlichen Publikationsbias . Negative Ergebnisse werden viel weniger einfach veröffentlicht, weil sie einfach keinen magischen p-Wert erreichen. Alle Wissenschaftszweige müssen bessere Wege finden, um wissenschaftlich wichtige und nicht nur statistisch signifikante Ergebnisse ans Licht zu bringen. (Das Mehrfachvergleichsproblem und der Umgang mit hochdimensionalen Daten sind Unterkategorien dieses Problems.)
Erforschung der Grenzen statistischer Methoden und ihrer Schnittstellen zum maschinellen Lernen und zur maschinellen Wahrnehmung . Unvermeidliche Fortschritte in der Computertechnologie werden wahre KI in unserem Leben zugänglich machen. Wie programmieren wir künstliche Gehirne? Welche Rolle könnten statistisches Denken und statistisches Lernen bei der Schaffung dieser Fortschritte spielen? Wie können Statistiker dabei helfen, über künstliches Erkennen und künstliches Lernen nachzudenken, ihre Grenzen auszuloten und Fortschritte zu erzielen?
Entwicklung besserer Methoden zur Analyse von Geodaten . Es wird oft behauptet, dass die Mehrheit oder die überwiegende Mehrheit der Datenbanken Standortreferenzen enthält. Bald werden viele Menschen und Geräte mit GPS- und Handytechnologien in Echtzeit lokalisiert. Statistische Methoden zur Analyse und Nutzung von Geodaten stecken noch in den Kinderschuhen (und scheinen auf GIS und Geodaten-Software, die in der Regel von Nicht-Statistikern verwendet wird, verwiesen zu werden).
quelle
Michael Jordan hat einen kurzen Artikel mit dem Titel Was sind die offenen Probleme in der Bayes'schen Statistik? , in dem er eine Reihe von Statistikern nach ihren Ansichten zu den offenen Problemen in der Statistik befragte. Ich werde hier ein wenig zusammenfassen (auch bekannt als "Kopieren und Einfügen"), aber es ist wahrscheinlich am besten, nur das Original zu lesen.
Nichtparametrie und Semiparametrie
Priors
Bayesianisch-frequentistische Beziehungen
Berechnung und Statistik
Modellauswahl und Hypothesentest
quelle
Ich bin nicht sicher, wie groß sie sind, aber es gibt eine Wikipedia-Seite für ungelöste Probleme in der Statistik. Ihre Liste enthält:
quelle
Als Beispiel für den allgemeinen Geist (wenn auch nicht ganz spezifischen) der Antwort, die ich suche, fand ich einen von "Hilberts 23" inspirierten Vortrag von David Donoho auf einer Konferenz "Math Challenges of the 21st Century":
Hochdimensionale Datenanalyse: Die Flüche und Segnungen der Dimensionalität
quelle
Mathoverflow hat eine ähnliche Frage zu großen Problemen in der Wahrscheinlichkeitstheorie .
Auf dieser Seite scheint es, als hätten die größten Fragen damit zu tun, zufällige Spaziergänge und Perkolationen zu vermeiden.
quelle
Sie können sich auch Harvards "Harte Probleme im Kolloquium der Sozialwissenschaften" ansehen, das zu Beginn dieses Jahres stattfand. Einige dieser Vorträge befassen sich mit Fragen der Verwendung von Statistiken und der Modellierung in den Sozialwissenschaften.
quelle
Meine Antwort wäre der Kampf zwischen frequentistischer und bayesianischer Statistik. Wenn Leute dich fragen, an was du "glaubst", ist das nicht gut! Besonders für eine wissenschaftliche Disziplin.
quelle