Berichten zufolge wird das CERN morgen bekannt geben, dass das Higgs-Boson experimentell mit 5- Beweisen nachgewiesen wurde. In diesem Artikel heißt es:
5 entspricht einer Wahrscheinlichkeit von 99,99994%, dass die Daten, die die CMS- und ATLAS-Detektoren sehen, nicht nur zufälliges Rauschen sind - und einer Wahrscheinlichkeit von 0,00006%, dass sie betrogen wurden. 5 ist die notwendige Gewissheit, damit etwas offiziell als wissenschaftliche „Entdeckung“ bezeichnet werden kann.
Dies ist nicht sehr streng, aber es scheint zu sagen, dass Physiker die statistische Standardmethode "Hypothesentest" anwenden, indem sie auf , was (zweiseitig) entspricht. Oder gibt es eine andere Bedeutung?
In weiten Teilen der Wissenschaft wird das Setzen von Alpha auf 0,05 natürlich routinemäßig durchgeführt. Dies wäre gleichbedeutend mit einem "Zwei- " -Zeichen, obwohl ich noch nie davon gehört habe, dass es so heißt. Gibt es andere Bereiche (außer der Teilchenphysik), in denen eine viel strengere Definition von Alpha Standard ist? Kennt jemand eine Referenz dafür, wie die Fünf- Regel von der Teilchenphysik akzeptiert wurde?
Update: Ich stelle diese Frage aus einem einfachen Grund. Mein Buch Intuitive Biostatistik (wie die meisten Statistikbücher) enthält einen Abschnitt, in dem erläutert wird, wie willkürlich die übliche "P <0,05" -Regel ist. Ich möchte dieses Beispiel für ein wissenschaftliches Gebiet hinzufügen, in dem der Wert von viel (viel!) Kleiner ist als notwendig erachtet wird. Wenn das Beispiel jedoch mit Bayes'schen Methoden komplizierter ist (wie einige Kommentare unten nahelegen), wäre es nicht ganz passend oder würde viel mehr Erklärung erfordern.
quelle
Antworten:
In den meisten statistischen Anwendungen gibt es den alten Spruch "Alle Modelle sind falsch, manche sind nützlich". In diesem Fall hätten wir nur erwartet, dass ein Modell auf einem bestimmten Niveau funktioniert, da wir einen unglaublich komplizierten Prozess mit einem einfachen Modell beschreiben.
Die Physik ist sehr unterschiedlich, daher ist die aus statistischen Modellen entwickelte Intuition nicht so angemessen. In der Physik, insbesondere in der Teilchenphysik, die sich direkt mit grundlegenden physikalischen Gesetzen befasst, soll das Modell tatsächlich eine genaue Beschreibung der Realität sein. Jede Abweichung von den Vorhersagen des Modells muss vollständig durch experimentelles Rauschen und nicht durch eine Einschränkung des Modells erklärt werden. Dies bedeutet , dass , wenn das Modell ist gut und richtig , und die experimentelle Vorrichtung verstand die statistische Signifikanz sollte sehr hoch sein , daher der eingestellte hohe Balken.
Der andere Grund ist historisch: Die Teilchenphysik wurde in der Vergangenheit verbrannt, weil „Entdeckungen“ auf niedrigeren Signifikanzniveaus später zurückgezogen wurden, weshalb sie jetzt im Allgemeinen vorsichtiger sind.
quelle
Geschichte und Herkunft
Laut Robert D. Cousins 1 und Tommaso Dorigo 2 liegt der Ursprung des 5 σ- Schwellenursprungs in der frühen Teilchenphysik der 60er Jahre, als zahlreiche Histogramme von Streuexperimenten untersucht und nach Peaks / Beulen gesucht wurden, die auf neu entdeckte Teilchen hindeuten könnten . Der Schwellenwert ist eine grobe Regel, um die mehrfachen Vergleiche zu berücksichtigen, die durchgeführt werden.1 2 5 σ
Beide Autoren verweisen auf einen Artikel aus dem Jahr 1968 aus Rosenfeld 3 , der sich mit der Frage befasste, ob es weit entfernte Mesonen und Baryonen gibt oder nicht, für die mehrere 4 σ- Effekte gemessen wurden. Der Artikel beantwortete die Frage negativ, indem er argumentierte, dass die Anzahl der veröffentlichten Patentansprüche der statistisch erwarteten Anzahl der Schwankungen entspreche. Zusammen mit mehreren Berechnungen, die dieses Argument stützen, förderte der Artikel die Verwendung der 5- σ- Ebene:3 4 σ 5 σ
und später in der Zeitung (Schwerpunkt liegt bei mir)
Tommaso scheint vorsichtig zu sein, dass es mit dem Rosenfeld-Artikel angefangen hat
Moderne Nutzung
Andere Felder
Es ist interessant festzustellen, dass viele andere wissenschaftliche Bereiche keine ähnlichen Schwellenwerte haben oder sich irgendwie nicht mit dem Thema befassen. Ich stelle mir vor, dass dies bei Experimenten mit Menschen etwas Sinn macht, bei denen es sehr kostspielig (oder unmöglich) ist, ein Experiment mit einer .05- oder .01-Signifikanz zu erweitern.
Cousins, RD (2017). Das Jeffreys-Lindley-Paradoxon und die Entdeckungskriterien in der Hochenergiephysik. Synthese, 194 (2), 395 & ndash; 432. arxiv link
Dorigo, T. (2013) Entmystifizierung des Fünf-Sigma-Kriteriums, von science20.com 2019-03-07
Rosenfeld, AH (1968). Gibt es weit entfernte Mesonen oder Baryonen? Web-Quelle: Stipendium
G. Burbidge, M. Roberts, S. Schneider, N. Sharp & W. Tifft (1990, November). Podiumsdiskussion: Probleme mit Redshift. In der NASA Conference Publication (Vol. 3098, S. 462). Link zur Fotokopie auf harvard.edu
Franklin, A. (2013). Verschiebungsmaßstäbe: Experimente in der Teilchenphysik im 20. Jahrhundert. University of Pittsburgh Press.
Was bedeutet das 5-Sigma? von physics.org 07.03.2019
Beringer, J., Arguin, JF, Barnett, RM, Copic, K., Dahl, O., Groom, DE, ... & Yao, WM (2012). Übersicht über die Teilchenphysik. Physical Review D-Teilchen, Felder, Gravitation und Kosmologie, 86 (1), 010001. (Abschnitt 36.2.2. Signifikanztests, Seite 394, Link aps.org )
Lyons, L. (2013). Die Bedeutung von 5 Sigma entdecken. arXiv-Vorabdruck arXiv: 1310.1284. arxiv link
Lyons, L. (2014). Statistische Probleme bei der Suche nach neuer Physik. arXiv preprint arxiv link
Baker, M. (2015). Über die Hälfte der Psychologiestudien scheitert am Reproduzierbarkeitstest. Nature News. von nature.com 07.03.2019
Horton, R. (2015). Offline: Was ist das 5-Sigma der Medizin? The Lancet, 385 (9976), 1380. von thelancet.com 2019-03-07
quelle
Aus einem ganz anderen Grund als der Physik gibt es andere Bereiche mit viel strengeren Alphas, in denen Hypothesentests durchgeführt werden. Genetische Epidemiologie gehört dazu, insbesondere wenn sie "GWAS" (Genome-Wide Association Study) verwenden, um verschiedene genetische Marker für Krankheiten zu untersuchen.
Da es sich bei einer GWAS-Studie um eine umfangreiche Übung zum Testen mehrerer Hypothesen handelt, basieren die modernsten Analysetechniken auf strengeren Alphas als 0,05. Andere solche "Kandidatenscreening" -Studientechniken, die im Anschluss an die Genomstudien folgen, werden wahrscheinlich dasselbe tun.
quelle
Der Pegel ist so hoch, dass verfrühte Ankündigungen von Nachrichten vermieden werden, die sich später als falsch herausstellen. Weitere Informationen hierzu finden Sie unter
https://physics.stackexchange.com/questions/8752/standard-deviation-in-particle-physics?rq=1
https://physics.stackexchange.com/questions/31126/how-many-sigma-did-the-discovery-of-the-w-boson-have
quelle