Ich weiß nicht, ob es nur ich bin, aber ich stehe Statistiken im Allgemeinen sehr skeptisch gegenüber. Ich kann es bei Würfeln, Pokerspielen usw. verstehen. Sehr kleine, einfache, meist in sich geschlossene wiederholte Spiele sind in Ordnung. Zum Beispiel ist eine Münze, die an ihrer Kante landet, klein genug, um die Wahrscheinlichkeit zu akzeptieren, dass die Landung von Kopf oder Zahl ~ 50% beträgt.
Ein $ 10-Pokerspiel mit dem Ziel eines 95% igen Gewinns ist in Ordnung. Aber was ist, wenn Ihre gesamte Lebensersparnis + mehr davon abhängt, ob Sie gewinnen oder nicht? Wie würde es mir helfen zu wissen, dass Sie in 95% der Fälle in dieser Situation gewinnen würden? Erwarteter Wert hilft da nicht viel.
Weitere Beispiele sind lebensbedrohliche Operationen. Wie hilft es zu wissen, dass es sich bei den vorhandenen Daten um eine 51% ige Überlebensrate gegenüber einer 99% igen Überlebensrate handelt? In beiden Fällen denke ich nicht, dass es für mich von Bedeutung ist, was der Arzt mir sagt, und ich würde es versuchen. Wenn die tatsächlichen Daten 75% betragen, kann er mir (abgesehen von Ethik und Gesetzen) auch sagen, dass es eine Überlebenschance von 99,99999% gibt, damit ich mich besser fühle. Mit anderen Worten, vorhandene Daten sind nur binomial von Bedeutung. Selbst dann spielt es keine Rolle, ob es eine Überlebensrate von 99,99999% gibt, wenn ich daran sterbe.
Auch Erdbebenwahrscheinlichkeit. Es spielt keine Rolle, ob sich alle x (wobei x> 100) Jahre im Durchschnitt ein starkes Erdbeben ereignete. Ich habe keine Ahnung, ob ein Erdbeben jemals in meinem Leben passieren wird. Warum sind es dann überhaupt nützliche Informationen?
Ein weniger ernstes Beispiel ist, dass 100% der Orte, an denen ich gewesen bin, die ich liebe, auf dem amerikanischen Kontinent liegen, gleichgültig gegenüber 100% der Orte, an denen ich in Europa gewesen bin, und 100% der Orte, die ich habe, hassen war in Asien. Nun, das bedeutet keineswegs, dass ich auf meiner nächsten Reise keinen Ort in Asien finden würde, den ich liebe oder der ich in Europa hasse oder in Amerika gleichgültig ist, nur weil die Statistiken nicht alle Informationen erfassen, die ich habe Ich kann wahrscheinlich nie alle Informationen erfassen, die ich benötige, selbst wenn ich auf über x% aller dieser Kontinente gereist bin. Nur weil es Unbekanntes auf dem 1-x-Prozent der Kontinente gibt, auf denen ich noch nicht war. (Fühlen Sie sich frei, die 100% durch einen anderen Prozentsatz zu ersetzen).
Ich verstehe, dass es keine Möglichkeit gibt, alles zu erzwingen, und dass Sie sich in vielen Situationen auf Statistiken verlassen müssen. Aber wie können wir glauben, dass Statistiken in unserer One-Shot-Situation hilfreich sind, insbesondere wenn Statistiken grundsätzlich nicht auf Ausreißer-Ereignisse hochgerechnet werden?
Irgendwelche Einsichten, um über meine Skepsis gegenüber Statistiken hinwegzukommen?
quelle
Antworten:
Zunächst denke ich, dass Sie möglicherweise "Statistiken" verwirren, die eine Sammlung von Zahlen oder anderen Fakten beschreiben, die eine Gruppe oder Situation beschreiben, und "Statistiken", die die Wissenschaft bezeichnen, Daten und Informationen zu verwenden, um die Welt angesichts von Variationen zu verstehen (andere mögen dies sein) meine Definitionen verbessern können). Statistiker verwenden beide Bedeutungen des Wortes, daher ist es nicht verwunderlich, wenn die Leute sie verwechseln.
In der Statistik (der Wissenschaft) geht es viel darum, Strategien auszuwählen und die beste Strategie zu wählen, auch wenn wir sie nur einmal anwenden dürfen. Manchmal, wenn ich (und andere) die Wahrscheinlichkeit unterrichte, verwenden wir das klassische Monty Hall-Problem (3 Türen, 2 Ziegen, 1 Auto), um es zu motivieren, und wir zeigen, wie wir Wahrscheinlichkeiten schätzen können, indem wir das Spiel einige Male spielen (nicht für Preise) ) und wir können sehen, dass die "switch" -Strategie 2/3 der Zeit gewinnt und die "stay" -Strategie nur 1/3 der Zeit gewinnt. Wenn wir nun die Gelegenheit hätten, das Spiel ein einziges Mal zu spielen, würden wir einige Dinge darüber wissen, welche Strategie eine bessere Gewinnchance bietet.
Das Operationsbeispiel ist ähnlich. Sie werden die Operation nur einmal durchführen lassen (oder nicht), möchten aber nicht wissen, welche Strategie mehr Menschen nutzt? Wenn Sie eine Operation mit einer Wahrscheinlichkeit von mehr als 0% des Überlebens oder keine Operation und 0% des Überlebens wählen, gibt es kaum einen Unterschied zwischen der Operation mit 51% Überleben und 99,9% Überleben. Aber was ist, wenn es auch andere Möglichkeiten gibt, können Sie wählen zwischen einer Operation, einem Nichtstun (25% Überleben) oder einer Ernährungsumstellung und einer Bewegung, die 75% Überleben hat (aber Anstrengung von Ihrer Seite erfordert), nein, nicht Interessiert es Sie, ob die Operationsoption ein Überleben von 51% gegenüber 99% aufweist?
Denken Sie auch an den Arzt, er wird mehr tun als nur Ihre Operation. Wenn eine Operation ein Überleben von 99,9% hat, hat er keinen Grund, Alternativen in Betracht zu ziehen, aber wenn sie nur ein Überleben von 51% hat, sollte er nach anderen Alternativen suchen, die dieses Überleben steigern. Ja, selbst bei einem Überleben von 90% verliert er einige Patienten, aber welche Strategie bietet ihm die besten Chancen, die meisten Patienten zu retten?
Heute Morgen habe ich mich beim Fahren angeschnallt (meine übliche Strategie), bin aber nicht in Unfälle geraten. War meine Strategie also Zeitverschwendung? Wenn ich wüsste, wann ich einen Unfall erleiden würde, könnte ich Zeit sparen, indem ich nur bei diesen Gelegenheiten den Sicherheitsgurt anlegte und nicht bei anderen. Aber ich weiß nicht, wann ich einen Unfall haben werde, also werde ich die Sicherheitsgurtstrategie beibehalten, weil ich glaube, dass sie mir die besten Chancen bietet, wenn ich jemals einen Unfall habe, auch wenn dies Zeitverschwendung bedeutet und Aufwand in dem hohen Prozentsatz (hoffentlich 100%) der Fälle, in denen es keinen Unfall gibt.
quelle
Nur weil Sie in Ihrem täglichen Leben keine Statistiken verwenden, bedeutet dies nicht, dass das Feld Sie nicht direkt betrifft. Wenn Sie beim Arzt sind und dieser eine Behandlung vor der anderen empfiehlt, können Sie darauf wetten, dass hinter dieser Empfehlung viele klinische Studien standen, die Statistiken zur Interpretation der Ergebnisse ihrer Experimente verwendeten.
Es stellt sich heraus, dass das Konzept des erwarteten Werts auch dann sehr nützlich ist, wenn Sie das Konzept nicht persönlich anwenden. Ihr Beispiel für das Wetten auf Ihre Lebensersparnis berücksichtigt nicht, wie risikobehaftet Sie sind. In anderen Situationen besteht möglicherweise ein geringeres Risiko oder es treten keine katastrophalen Folgen auf. Beispiele hierfür sind Wirtschaft, Finanzen, Versicherungsmathematik und andere. Vielleicht schließen Sie eine Hausratversicherung ab - dann ist es von großer Bedeutung, plötzlich die Wahrscheinlichkeit eines Erdbebens innerhalb eines bestimmten Zeitraums zu kennen.
Letztendlich ist Statistik eine großartige Möglichkeit, mit Unsicherheit umzugehen. In Ihrem letzten Beispiel haben Sie einige Daten zu Orten zusammengestellt, die Sie gerne bereisen, und behauptet, dass Statistiken besagen, dass Sie in Asien niemals einen Ort finden werden, den Sie mögen. Das ist einfach falsch. Natürlich lassen diese Daten Sie vermuten, dass Asien mit geringerer Wahrscheinlichkeit einen Ort hat, den Sie mögen, aber Sie können Ihre vorherige Überzeugung so festlegen, wie Sie möchten, und Statistiken zeigen Ihnen, wie Sie Ihre Überzeugung angesichts der neuen Daten aktualisieren können. Darüber hinaus können Sie Ihren Glauben auf eine prinzipielle Weise ändern, die es Ihnen ermöglicht, in Gegenwart von Unsicherheit rational zu handeln.
quelle
Die Welt ist stochastisch und nicht deterministisch. Wenn es deterministisch wäre, würden die Physiker die Welt regieren und die Statistiker wären arbeitslos. In Wirklichkeit sind Statistiker in fast allen Disziplinen gefragt. Das heißt nicht, dass es keinen Platz für Physik und andere Wissenschaften gibt, aber Statistik arbeitet Hand in Hand mit Wissenschaft und ist die Grundlage für viele wissenschaftliche Entdeckungen.
Genug geredet und bis zu Einzelheiten. Ich habe die letzten 17 Jahre in der Medizinbranche gearbeitet, zuerst in Medizinprodukten, dann in der Pharmaindustrie und jetzt in der allgemeinen medizinischen Forschung. In diesem Land und auf der ganzen Welt werden regelmäßig Medikamente und Medizinprodukte entwickelt und zugelassen, die die Lebensqualität verbessern und oftmals Leben retten oder verlängern. In den USA erfordert die Zulassung den Nachweis der Sicherheit und Wirksamkeit, bevor die FDA die Vermarktung eines Arzneimittels oder Medizinprodukts zulässt. Beweise für die FDA stammen aus klinischen Studien in Phasen. Alle klinischen Studien erfordern gültige statistische Auslegungs- und Analysemethoden. Nichts ist perfekt. Medikamente wirken bei manchen Menschen gut, während andere möglicherweise nicht ansprechen oder unerwünschte Ereignisse haben (schlechte Reaktionen, die Krankheit oder Tod verursachen können). Die Studien trennen die unwirksamen Medikamente von den wirksamen. Die meisten Medikamente scheitern und es gibt oft einen zehnjährigen Zyklus von der frühen Entwicklung bis zum Ende der Phase III mit Zulassung und Vermarktung am Ende der Studie. Eine Überwachung nach dem Inverkehrbringen, für die auch Statistiken erforderlich sind, wird angewendet, um sicherzustellen, dass das Medikament für die allgemeine Bevölkerung ausreichend wirksam ist. Manchmal ist die Allgemeinbevölkerung, für die das Medikament zugelassen ist, weniger restriktiv als die Patienten, die für die klinischen Studien in Frage kamen. Manchmal erweisen sich Drogen als gefährlich und werden vom Markt genommen. Statistiken helfen in allen Aspekten der Arzneimittelsicherheit. Eine Überwachung nach dem Inverkehrbringen, für die auch Statistiken erforderlich sind, wird angewendet, um sicherzustellen, dass das Medikament für die allgemeine Bevölkerung ausreichend wirksam ist. Manchmal ist die Allgemeinbevölkerung, für die das Medikament zugelassen ist, weniger restriktiv als die Patienten, die für die klinischen Studien in Frage kamen. Manchmal erweisen sich Drogen als gefährlich und werden vom Markt genommen. Statistiken helfen in allen Aspekten der Arzneimittelsicherheit. Eine Überwachung nach dem Inverkehrbringen, für die auch Statistiken erforderlich sind, wird angewendet, um sicherzustellen, dass das Medikament für die allgemeine Bevölkerung ausreichend wirksam ist. Manchmal ist die Allgemeinbevölkerung, für die das Medikament zugelassen ist, weniger restriktiv als die Patienten, die für die klinischen Studien in Frage kamen. Manchmal erweisen sich Drogen als gefährlich und werden vom Markt genommen. Statistiken helfen in allen Aspekten der Arzneimittelsicherheit.
Statistik ist nicht perfekt. Wir leben mit einigen Fehlern aufgrund von Zufälligkeit und Unsicherheit. Aber es ist kontrolliert und unser Leben ist besser und die Fehler sind geringer, als wenn die statistische Wissenschaft nicht beteiligt gewesen wäre.
quelle
Ich selbst habe dieselben Zweifel an der Nützlichkeit von Wahrscheinlichkeit und Statistik, wenn es darum geht, Entscheidungen über ein einzelnes Ereignis zu treffen. Meiner Meinung nach ist die Kenntnis der tatsächlichen oder geschätzten Wahrscheinlichkeit äußerst wichtig, wenn es darum geht, die Ergebnisse von Stichproben zu schätzen, sei es ein einzelnes Ereignis, das mehrmals wiederholt wurde, oder eine Stichprobe, die von einer bestimmten Population ertrunken ist. Kurz gesagt, die Wahrscheinlichkeit zu kennen, ist sinnvoller für das Casino, das auf der Grundlage von Wahrscheinlichkeitsberechnungen die Regeln aufstellen kann, die garantieren, dass er auf lange Sicht (nach vielen Spielen) gewinnt, und nicht für einen Spieler, der vorgibt, einmal zu spielen würde gewinnen oder verlieren (dies sind die Ergebnisse, wenn das Experiment ein einziges Mal ausgeführt wird). Es ist auch wichtig für die Generäle, die erwägen, ihre Soldaten in einen Kampf zu schicken, mit dem Risiko (Wahrscheinlichkeit), 10% von ihnen zu verlieren. aber nicht für ein bestimmtes Lot (sagen wir John), das nur sterben oder überleben wird. Es gibt so viele Beispiele wie diese im wirklichen Leben.
Der Punkt, den ich ansprechen möchte, ist, dass Wahrscheinlichkeit und Statistik nicht nur im wirklichen Leben nützlich sind, sondern genauer gesagt, sie sind ein Werkzeug für alle modernen wissenschaftlichen Forschungen und Entscheidungsregeln. Es ist jedoch nicht richtig zu sagen, dass Rationalität bedeutet, sich für die Schätzung des Ergebnisses auf die Wahrscheinlichkeit eines einzelnen Ereignisses zu verlassen, ohne die Absicht oder die Möglichkeit, es zu wiederholen. Die Tendenz der Wahrscheinlichkeit, die Entscheidung einer bestimmten Person auf der Grundlage ihrer oder ihrer Risikoaversion zu beeinflussen, ist offensichtlich subjektiv. Risikoabwehr und Risikoliebhaber haben unterschiedliche Einstellungen (Entscheidungen) gegenüber derselben Lotterie (gleicher Erwartungswert).
quelle
Das Lange und Kurze ist, dass Wahrscheinlichkeit die eindeutige Verallgemeinerung der gewöhnlichen Wahr / Falsch-Logik zu Glaubensgraden zwischen 0 und 1 ist. Dies ist die sogenannte logische Bayes'sche Interpretation der Wahrscheinlichkeit, die von RT Cox stammt und später von ET verfochten wird Jaynes.
Darüber hinaus kann unter schwachen Annahmen gezeigt werden, dass der richtige Weg, um ungewisse Ergebnisse nach Präferenz zu ordnen, darin besteht, sie nach dem erwarteten Nutzen zu ordnen, wobei das Erwartete in Bezug auf die Wahrscheinlichkeitsverteilung über die Ergebnisse genommen wird.
Siehe Robert Clemen, "Making Hard Decisions", für eine Einführung und Erläuterung zur angewandten Entscheidungsanalyse, die auf der Bayes'schen Wahrscheinlichkeit und dem erwarteten Nutzen basiert.
Sie haben absolut Recht, konventionellen frequentistischen Statistiken skeptisch gegenüberzustehen. Nach dem Entwurf seiner Erfinder (RA Fisher, J. Neyman, E. Pearson) ist es auf sich wiederholende Ereignisse beschränkt. Bei vielen alltäglichen Problemen handelt es sich jedoch nicht um sich wiederholende Ereignisse. Was ist zu tun? Der typische Ansatz besteht darin, quadratische Stifte in runde Löcher zu zwingen und die Torpfosten zu bewegen. Wirklich beschämend.
quelle
Ich bin aus folgenden Gründen skeptisch gegenüber Statistiken.
Ich bin überzeugt, dass jeder ohne Abschluss in Statistik keine Ahnung hat, was er tut. Unf. Weltweit forschen Millionen von Menschen ohne Abschluss in Statistik. Ich war ein Bachelor-Mathematik-Major an der Universität von Maryland College, Park. Ich habe 4 Matheklassen mit 400 Niveaus belegt. Alle Lehrer haben dir beigebracht, wie man Sachen berechnet. Niemand hat mir beigebracht, wie man einen Sinn ergibt oder eine statistische Analyse durchführt, außer Hypothesentests, die aus zwei Gründen keinen Sinn ergeben.
1. Für jeden Hypothesentest, der mir beigebracht wurde, musste ich vorher Annahmen treffen. Niemand hat mir beigebracht, mit welchen Annahmen ich anfangen musste. 2. P-Werte ergeben logisch keinen Sinn. Ein Abschluss in Statistik kann Ihnen zeigen, was ein p-Wert tatsächlich ist. Ich bin jedoch überzeugt, dass kein Student weiß, wie man es benutzt. Die Undergraduate-Definition geht von einer Wahrscheinlichkeit aus, dass etwas von der Richtigkeit der Hypothese abhängt. Logischerweise macht die Definition überhaupt keinen Sinn. Schlimmer noch, NIEMAND hat mir jemals gesagt, woher die Wahrscheinlichkeit kommt. Ich habe tatsächlich fast meine gesamte mathematische Abteilung (mehr als 200 Personen) per E-Mail benachrichtigt, wenn mir jemand eine Antwort geben könnte. Die beliebtesten und einzigen Antworten waren "Man müsste die Fehlerraten für die Wahrscheinlichkeit annehmen" (Als ich die Leute fragte, wie das gemacht wurde, antworteten sie mir alle.)
Dasselbe geschah, als ich gegoogelt habe, wie wichtig ein p-Wert ist. Es führt mich zum Schluss ...
Sogar eine Sig. Die Anzahl der Mathematik- und Statistikprofessoren hat keine Ahnung, welche Logik hinter der Statistik steckt. Ich erwarte nicht, dass die Leute gründliche Kenntnisse haben. Ich habe jedoch das Gefühl, dass sogar eine Sig. % der Forscher und Professoren verstehen die zugrunde liegende Logik der Statistik nicht.
Statistischer Fehler ist nicht dasselbe wie tatsächlicher Fehler. Da Menschen gerne Statistiken verwenden, um Schätzungen für Dinge abzuleiten, die schwerwiegend sind, verwenden sie gern statistische Fehler, um die Tatsache zu "maskieren", dass sie keine Ahnung haben, was der tatsächliche Fehler ist.
Menschen verwenden kleine Stichproben für große Bevölkerungsgruppen, weil ihnen die statistische Theorie sagt, dass sie dies können. Ich habe aus einem meiner College-Kurse erfahren, dass die Leute gerne Daten verwenden, die Schätzungen von etwa 30 Schulen im Land entsprechen, um zu zeigen, dass es an Schulen im ganzen Land nur wenige gewalttätige Vorfälle gibt. Es gibt ungefähr 100.000 Schulen. Das klingt verrückt. Eine ganze Volksbewegung setzt sich aus etwa 30 Schulen im ganzen Land zusammen.
Die Beweislast wird gerne statistisch erfasst. Die Higgs-Blüte wurde nie entdeckt. Es wurde statistisch entdeckt, aber das hat nichts zu bedeuten. Was rein statistisch entdeckt wird, nützt nichts, weil niemand die Genauigkeit von Statistiken kennt.
Menschen nutzen Statistiken gerne, um wichtige Entscheidungen zu treffen. Statistiken können als Anhaltspunkt dienen, aber niemand weiß, wie genau sie wirklich sind. Nur weil ein Problem unmöglich zu lösen scheint, heißt das noch lange nicht, dass Statistik das nächstbeste ist. Die Tatsache, dass DNA-Tests auf statistischen Daten basieren, bereitet mir Angst. Kann ich die Todesstrafe nur aufgrund von Statistiken erhalten? Könnte ein Mörder allein aufgrund von Statistiken aus dem Gefängnis entlassen werden?
Ich glaube, dass Statistiken nützlich sein können, aber nur, wenn sie nicht als Schlussfolgerung herangezogen werden. Ich glaube, Statistiken können uns Aufschluss über einige der Möglichkeiten geben. Dann sollte nicht statistische Logik, sondern Logik verwendet werden, um zu beweisen, welche Möglichkeit (en) richtig ist (sind).
quelle