Ich helfe meinen Jungen, die gerade in der Highschool sind, Statistiken zu verstehen, und ich denke darüber nach, mit ein paar einfachen Beispielen zu beginnen, ohne dabei einige Einblicke in die Theorie zu ignorieren.
Mein Ziel wäre es, ihnen den intuitivsten und doch instrumentell konstruktivsten Ansatz zu geben, um Statistiken von Grund auf neu zu lernen, um ihr Interesse an der weiteren Verfolgung von Statistiken und quantitativem Lernen zu wecken.
Bevor ich anfange, habe ich jedoch eine bestimmte Frage mit sehr allgemeinen Auswirkungen:
Sollten wir anfangen, Statistik mit einem Bayes'schen oder einem frequentistischen Rahmen zu unterrichten?
Nachforschungen haben ergeben, dass ein gemeinsamer Ansatz mit einer kurzen Einführung in die frequentistische Statistik beginnt, gefolgt von einer eingehenden Erörterung der Bayes'schen Statistik (z . B. Stangl ).
Antworten:
Sowohl die Bayes-Statistik als auch die Frequentist-Statistik basieren auf der Wahrscheinlichkeitstheorie, aber ich würde sagen, dass die erstere von Anfang an stärker auf der Theorie beruht. Andererseits ist das Konzept eines glaubwürdigen Intervalls sicherlich intuitiver als das eines Konfidenzintervalls, wenn der Schüler das Konzept der Wahrscheinlichkeit erst einmal richtig verstanden hat. Also, was auch immer Sie wählen, ich befürworte zuallererst, ihr Verständnis von Wahrscheinlichkeitskonzepten zu stärken, mit all diesen Beispielen, die auf Würfeln, Karten, Roulette, Monty Hall-Paradox usw. basieren.
Ich würde den einen oder den anderen Ansatz auf der Grundlage eines rein utilitaristischen Ansatzes wählen: Studieren sie in der Schule häufiger frequentistische oder bayesianische Statistiken? In meinem Land würden sie auf jeden Fall zuerst das frequentistische Gerüst lernen (und zuletzt: Sie haben noch nie von Schülern gehört, denen Bayes-Statistiken beigebracht wurden. Die einzige Chance besteht entweder an der Universität oder danach im Selbststudium). Vielleicht ist es bei Ihnen anders. Denken Sie daran, dass, wenn sie sich mit NHST (Null Hypothesis Significance Testing) befassen müssen, dies natürlicher im Kontext der frequentistischen Statistik, IMO, auftritt. Natürlich können Sie Hypothesen auch im Bayes'schen Rahmen testen, aber es gibt viele führende Bayes'sche Statistiker, die sich dafür aussprechen, NHST überhaupt nicht zu verwenden, weder im Frequentist- noch im Bayes'schen Rahmen (zum Beispiel Andrew Gelman von der Columbia University).
Schließlich weiß ich nicht, wie hoch das Niveau der Gymnasiasten in Ihrem Land ist, aber in meinem Fall wäre es für einen Schüler wirklich schwierig, gleichzeitig Wahrscheinlichkeitstheorie und Integralrechnung (die Grundlagen der Wahrscheinlichkeitstheorie) erfolgreich zu verarbeiten. Wenn Sie sich also für die Bayes'sche Statistik entscheiden, würde ich den Fall der kontinuierlichen Zufallsvariablen wirklich vermeiden und mich an diskrete Zufallsvariablen halten.
quelle
Bayesianer und Frequentist stellen unterschiedliche Fragen. Bayesian fragt, welche Parameterwerte angesichts der beobachteten Daten glaubwürdig sind. Der Frequentist fragt nach der Wahrscheinlichkeit von imaginären simulierten Daten, wenn einige hypothetische Parameterwerte wahr sind. Häufige Entscheidungen beruhen auf Kontrollfehlern, Bayes'sche Entscheidungen auf Unsicherheiten in den Modellbeschreibungen.
Was solltest du zuerst unterrichten? Nun, wenn Sie die eine oder andere dieser Fragen zuerst stellen möchten, ist dies Ihre Antwort. Aber in Bezug auf Zugänglichkeit und Pädagogik denke ich, dass Bayesian viel einfacher zu verstehen und viel intuitiver ist. Die Grundidee der Bayes'schen Analyse ist die Umverteilung der Glaubwürdigkeit auf die verschiedenen Möglichkeiten, wie Sherlock Holmes es bereits sagte und die Millionen von Lesern intuitiv verstanden haben. Die Grundidee der frequentistischen Analyse ist jedoch sehr herausfordernd: Der Raum aller möglichen Datensätze, die sich ergeben könnten, wenn eine bestimmte Hypothese wahr wäre, und der Anteil der imaginären Datensätze, deren Zusammenfassungsstatistik mindestens so extrem ist wie die Zusammenfassung tatsächlich beobachtete Statistik.
Ein kostenloses Einführungskapitel über Bayes'sche Ideen finden Sie hier . Ein Artikel, der häufig auftretende und bayesianische Konzepte nebeneinander setzt, ist hier . Der Artikel erklärt häufig auftretende und bayesianische Ansätze zum Testen von Hypothesen und zur Schätzung (und viele andere Dinge). Der Rahmen des Artikels kann besonders für Anfänger nützlich sein, die versuchen, sich einen Überblick über die Landschaft zu verschaffen.
quelle
Diese Frage könnte auf einer Meinung beruhen, deshalb werde ich versuchen, mich mit meiner Meinung kurz zu fassen und Ihnen dann einen Buchvorschlag zu machen. Manchmal lohnt es sich, einen bestimmten Ansatz zu wählen, da dies der Ansatz ist, den ein besonders gutes Buch verfolgt.
Ich würde zustimmen, dass Bayes-Statistiken intuitiver sind. Die Unterscheidung zwischen Konfidenzintervall und glaubwürdigem Intervall bringt es auf den Punkt: Die Leute denken natürlich in Begriffen wie "Was ist die Chance, dass ..." und nicht wie das Konfidenzintervall. Der Konfidenzintervall-Ansatz klingt sehr ähnlich wie das Glaubwürdige Intervall, mit der Ausnahme, dass Sie im Allgemeinen nicht den letzten Schritt von "95% der Zeit" zu "95% der Chance" machen können, was sehr häufig erscheint, aber Sie kann es nicht machen. Es ist nicht inkonsistent, nur nicht intuitiv.
Dies auszugleichen ist die Tatsache, dass die meisten College-Kurse, die sie belegen werden, den weniger intuitiven Ansatz des Frequentisten verwenden.
Das Buch Statistical Rethinking: A Bayesian Course mit Beispielen in R und Stan von Richard McElreath gefällt mir sehr gut. Es ist nicht billig, also lesen Sie es bitte durch und stöbern Sie bei Amazon, bevor Sie es kaufen. Ich finde es ein besonders intuitiver Ansatz, der den Bayes'schen Ansatz nutzt und sehr praktisch ist. (Und da R und Stan ausgezeichnete Werkzeuge für Bayesianische Statistiken sind und kostenlos sind, ist es praktisches Lernen.)
EDIT: In einigen Kommentaren wurde erwähnt, dass das Buch wahrscheinlich nicht für ein Abitur geeignet ist, selbst wenn ein erfahrener Tutor anwesend ist . Also muss ich noch eine Einschränkung machen: Am Anfang hat es eine einfache Herangehensweise, die sich aber schnell erhöht. Es ist ein erstaunliches Buch, aber Sie müssten es wirklich auf Amazon durchgehen, um ein Gefühl für seine anfänglichen Annahmen zu bekommen und wie schnell es ansteigt. Wunderschöne Analogien, großartige praktische Arbeit in R, unglaublicher Ablauf und Organisation, aber vielleicht nicht nützlich für Sie.
Es werden Grundkenntnisse in Programmierung und R (kostenloses Statistikpaket) sowie Grundkenntnisse in Wahrscheinlichkeit und Statistik vorausgesetzt. Es ist kein Direktzugriff und jedes Kapitel baut auf vorherigen Kapiteln auf. Es beginnt sehr einfach, obwohl die Schwierigkeit in der Mitte zunimmt - es endet in einer mehrstufigen Regression. Vielleicht möchten Sie einen Teil davon bei Amazon in der Vorschau anzeigen und entscheiden, ob Sie die Grundlagen problemlos erläutern können oder ob es etwas zu weit in die Tiefe springt.
EDIT 2: Das Fazit meines Beitrags hier und der Versuch, ihn von der reinen Meinung abzuwenden, ist, dass ein gutes Lehrbuch entscheiden kann, welchen Ansatz Sie wählen. Ich würde einen bayesianischen Ansatz bevorzugen, und dieses Buch macht das gut, aber vielleicht zu schnell.
quelle
Mir wurde zuerst der frequentistische Ansatz beigebracht, dann der bayesianische. Ich bin kein professioneller Statistiker.
Ich muss zugeben, dass ich meine Vorkenntnisse des frequentistischen Ansatzes nicht als entscheidend für das Verständnis des Bayes'schen Ansatzes angesehen habe.
Ich wage zu sagen, es hängt davon ab, welche konkreten Anwendungen Sie Ihren Schülern als Nächstes zeigen und wie viel Zeit und Mühe Sie dafür aufwenden werden.
Nachdem ich das gesagt habe, würde ich mit Bayes beginnen.
quelle
Der Bayes'sche Rahmen ist eng mit allgemeinen Fähigkeiten zum kritischen Denken verknüpft. Es ist das, was Sie in den folgenden Situationen brauchen:
Dies ist auch viel interessanter als das Auswendiglernen der Formel für einen t-Test mit zwei Stichproben: p. Dies erhöht die Wahrscheinlichkeit, dass die Studenten lange genug interessiert bleiben, um sich mit zunehmend technischem Material zu beschäftigen.
quelle
Niemand hat die Wahrscheinlichkeit erwähnt, die für die Bayes'sche Statistik von grundlegender Bedeutung ist. Ein Argument dafür, Bayes zuerst zu unterrichten, ist, dass der Fluss von Wahrscheinlichkeit zu Wahrscheinlichkeit zu Bayes ziemlich nahtlos ist. Bayes können aufgrund der Wahrscheinlichkeit motiviert werden, indem festgestellt wird, dass (i) die Wahrscheinlichkeitsfunktion wie eine Wahrscheinlichkeitsverteilungsfunktion aussieht (und wirkt), aber nicht, weil die Fläche unter der Kurve nicht 1,0 ist, und (ii) der rohe, häufig verwendete Wald Intervalle nehmen eine Wahrscheinlichkeitsfunktion an, die proportional zu einer Normalverteilung ist, aber die Bayes'schen Methoden überwinden diese Einschränkung leicht.
Ein weiteres Argument für Bayes ist, dass die Bedenken von P (A | B) gegenüber P (B | A) in Bezug auf p-Werte leichter erklärt werden können, wie von anderen erwähnt.
Ein weiteres Argument für "Bayes first" besteht darin, dass die Schüler gezwungen werden, Bedingungswahrscheinlichkeitsmodelle genauer zu betrachten, was an anderer Stelle nützlich ist, z. B. bei der Regressionsanalyse.
Entschuldigen Sie die Eigenwerbung, aber da sie sich ausschließlich auf das Thema bezieht , macht es mir nichts aus, dass dies genau der Ansatz ist, den Keven Henning und ich in unserem Buch "Understanding Advanced Statistical Methods" ( https: // peterwestfall. wixsite.com/book-1 ) deren Zielgruppe Nicht-Statistiker sind.
quelle
Unterrichten Sie zum Spaß und zur Einsicht oder für den praktischen Gebrauch? Wenn es um Lehren und Verstehen geht, gehe ich zu Bayes. Wenn aus praktischen Gründen, würde ich auf jeden Fall Frequentist gehen.
In vielen Bereichen - und ich nehme an, in den meisten Bereichen - der Naturwissenschaften werden die Arbeiten mit einem p-Wert veröffentlicht. Ihre "Jungs" müssen die Papiere anderer Leute lesen, bevor sie ihre eigenen schreiben können. Um die Arbeiten anderer Leute zu lesen, müssen sie, zumindest in meinem Fachgebiet, Nullhypothesen und p-Werte verstehen, egal wie dumm sie nach Bayes'schen Studien aussehen mögen. Und selbst wenn sie bereit sind, ihre erste Arbeit zu veröffentlichen, werden sie wahrscheinlich einen hochrangigen Wissenschaftler an der Spitze des Teams haben. Wahrscheinlich bevorzugen sie den Frequentismus.
Abgesehen davon stimme ich @Wayne darin zu, dass das statistische Umdenken einen sehr klaren Weg in Richtung Bayes-Statistik als ersten Ansatz zeigt und nicht auf dem vorhandenen Wissen über Frequentismus basiert. Es ist großartig, wie dieses Buch nicht versucht, Sie in einem Kampf um die bessere oder schlechtere Statistik zu überzeugen. Das angegebene Argument des Autors für Bayes ist (IIRC), dass er beide Arten unterrichtet hat und Bayes leichter zu unterrichten war.
quelle
Ich würde mich von Bayesian fernhalten und den Riesen folgen.
Die Sowjets hatten eine ausgezeichnete Buchreihe für Schüler der Sekundarstufe, die grob als "Quant" -Bibliothek übersetzt wurde. Kolmogorov steuerte ein Buch mit dem Titel "Einführung in eine Wahrscheinlichkeitstheorie" bei. Ich bin mir nicht sicher, ob es jemals ins Englische übersetzt wurde, aber hier ist der Link zu seinem russischen Original.
Sie nähern sich der Erklärung der Wahrscheinlichkeiten durch Kombinatorik, was meiner Meinung nach der beste Weg ist, um anzufangen. Das Buch ist sehr zugänglich für einen Gymnasiasten mit guten Mathematikkenntnissen. Beachten Sie, dass die Sowjets Mathe ziemlich ausführlich unterrichteten, so dass die durchschnittlichen westlichen Gymnasiasten möglicherweise nicht so gut vorbereitet sind, aber meiner Meinung nach mit genügend Interesse und Willenskraft mit dem Inhalt noch umgehen können.
Der Inhalt ist sehr interessant für Schüler, es gibt zufällige Spaziergänge, begrenzte Verteilungen, Überlebensprozesse, Gesetze über große Zahlen usw. Wenn Sie diesen Ansatz mit Computersimulationen kombinieren, wird es noch lustiger.
quelle