Was sollte zuerst gelehrt werden: Wahrscheinlichkeit oder Statistik?

19

Ich bin neu als Fakultätsmitglied in einer mathematischen Abteilung eingestiegen. einer renommierten Institution. Ich werde den Kurs Wahrscheinlichkeitsrechnung und Statistik im Grundstudium unterrichten. Die Institution hat bereits einen Lehrplan für diesen Kurs, mit dem ich nicht sehr zufrieden bin. In diesem Lehrplan wird zuerst die Statistik behandelt, außerdem fehlt ein Schätzteil. Ich war immer der Meinung, dass Grundlagen der Wahrscheinlichkeit vor dem Lehren der Statistik vermittelt werden sollten. Kann jemand eine Meinung dazu abgeben? Auch ein Vorschlag für die Themen, die in einem solchen Kurs behandelt werden sollen, wird sehr geschätzt.

Ashok
quelle
3
Es scheint mir, dass ein grundlegendes Verständnis der Wahrscheinlichkeit (nicht notwendigerweise von zu mathematischen Konzepten) erforderlich ist, um die Logik und Intuition hinter statistischen Techniken zu erlangen, was durch die Tatsache belegt wird, dass die meisten Statistikbücher der Elementarstufe mit der Wahrscheinlichkeit beginnen. Auch in meiner Business-Klasse wurden uns zuerst Wahrscheinlichkeit und dann Statistik beigebracht.
RSL
4
Ist das theoretische oder angewandte Statistik? Ein Großteil der angewandten Statistiken kann ohne detaillierte Einführung in die Wahrscheinlichkeit gedacht werden. Es könnte später auch ein guter Apetizer für Wahrscheinlichkeits- und theoretische Statistiken sein. Es muss also keine so schlechte Idee sein.
Tim
3
Welche Studiengänge absolvieren die Studierenden? Sind sie Hauptfach Mathematik oder wird das Modul hauptsächlich für Studierende aus anderen Fachbereichen angeboten, zum Beispiel Soziologie oder Wirtschaft?
Robert Long
@ Robert Long: Es wird gesagt, dass mechanische engg. Studenten und unsere eigenen Mathe-Hauptstudenten werden an dem Kurs teilnehmen. Andere aus der Wirtschaft Elektrotechnik und Informatikstudenten könnten ebenfalls teilnehmen.
Ashok

Antworten:

22

Es scheint keine Frage der Meinung mehr zu sein: Die Welt scheint sich weit über die traditionelle "Wahrscheinlichkeit lehren und dann Statistik als Anwendung lehren" hinausbewegt zu haben. Sehen Sie sich die Liste der Titel in der letztjährigen Sonderausgabe von The American Statistician an ( siehe Abbildung unten), um einen Eindruck davon zu bekommen, wo der Unterricht in Statistik stattfindet : Keiner von ihnen bezieht sich auf die Wahrscheinlichkeit.

Sie diskutieren die Lehre der Wahrscheinlichkeit und ihre Rolle im Lehrplan. Ein gutes Beispiel ist George Cobbs Artikel und seine Antworten . Hier sind einige relevante Zitate:

Die moderne statistische Praxis ist viel weiter gefasst als in unserem traditionellen Lehrplan für wahrscheinlichkeitsbasierte Inferenz anerkannt.

Was wir unterrichten, bleibt Jahrzehnte hinter dem zurück, was wir praktizieren. Unser curriculares Paradigma betont die formale Folgerung aus einer frequentistischen Orientierung, die entweder auf dem zentralen Grenzwertsatz auf der Einstiegsebene oder im Kurs für Hauptfächer der Mathematik auf einem kleinen Satz parametrischer Wahrscheinlichkeitsmodelle basiert, die sich für mithilfe von Kalkül hergeleitete geschlossene Lösungen eignen . Die Kluft zwischen unserem über ein halbes Jahrhundert alten Lehrplan und unserer heutigen statistischen Praxis vergrößert sich weiter.

Meine These ... ist, dass wir als Beruf erst begonnen haben, die Möglichkeiten auszuloten. Die Geschichte unseres Faches stützt auch diese These: Anders als die Wahrscheinlichkeit, ein Spross der Mathematik, sprossen Statistiken de novo aus dem Boden der Wissenschaft.

Wahrscheinlichkeit ist ein notorisch rutschiges Konzept. Die Kluft zwischen Intuition und formaler Behandlung kann größer sein als in jedem anderen Zweig der angewandten Mathematik. Wenn wir darauf bestehen, dass statistisches Denken notwendigerweise auf einem Wahrscheinlichkeitsmodell basieren muss, wie vereinbaren wir diese Anforderung mit dem Ziel, zentrale Ideen „einfach und zugänglich“ zu machen und „Forschungsvoraussetzungen“ zu minimieren?

Führen Sie als Gedankenexperiment die Grundbegriffe und die Theorie der Schätzung durch. Beachten Sie, dass fast alle davon nur mit Hilfe der Erstsemesterrechnung erklärt und illustriert werden können, wobei die Wahrscheinlichkeit mit der Zeit eingeführt wurde.

Natürlich möchten wir, dass die Schülerinnen und Schüler Analysis und Wahrscheinlichkeit lernen, aber es wäre schön, wenn wir gemeinsam mit allen anderen Wissenschaften den Erstsemestern die grundlegenden Konzepte unseres Fachs beibringen könnten.

Es gibt weit mehr davon. Sie können es selbst lesen; das material ist frei verfügbar.

Verweise

Die Sonderausgabe des amerikanischen Statistikers zu "Statistics and the Undergraduate Curriculum" (November 2015) ist unter http://amstat.tandfonline.com/toc/utas20/69/4 verfügbar .

Unterrichten der nächsten Generation von Statistikstudenten zum „Denken mit Daten“: Sonderheft zu Statistik und dem Bachelor-Lehrplan Nicholas J. Horton und Johanna S. Hardin DOI: 10.1080 / 00031305.2015.1094283

Bloße Renovierung ist zu wenig zu spät: Wir müssen unseren Studienplan von Grund auf überdenken George Cobb DOI: 10.1080 / 00031305.2015.1093029

Unterrichtsstatistik im Google-Maßstab Nicholas Chamandy, Omkar Muralidharan und Stefan Wager Seiten 283-291 DOI: 10.1080 / 00031305.2015.1089790

Erkundungen in der Statistikforschung: Ein Ansatz zur Aufdeckung von Studenten für authentische Datenanalysen Deborah Nolan & Duncan Temple Lang DOI: 10.1080 / 00031305.2015.1073624

Beyond Normal: Vorbereitung von Studenten auf die Erwerbstätigkeit in einer statistischen Beratungsstelle Capstone Byran J. Smucker & A. John Bailer DOI: 10.1080 / 00031305.2015.1077731

Ein Framework zum Einbringen authentischer Datenerfahrungen in Statistikkurse Scott D. Grimshaw DOI: 10.1080 / 00031305.2015.1081106

Förderung des konzeptuellen Verständnisses in der mathematischen Statistik Jennifer L. Green und Erin E. Blankenship DOI: 10.1080 / 00031305.2015.1069759

Der zweite Kurs in Statistik: Design und Analyse von Experimenten? Natalie J. Blades, G. Bruce Schaalje und William F. Christensen DOI: 10.1080 / 00031305.2015.1086437

Ein Data Science-Kurs für Studenten: Denken mit Daten Ben Baumer DOI: 10.1080 / 00031305.2015.1081105

Data Science in Statistics Curricula: Vorbereitung der Schüler auf das „Denken mit Daten“ J. Hardin, R. Hoerl, Nicholas J. Horton, D. Nolan, B. Baumer, O. Hall-Holt, P. Murrell, R. Peng, P Roback, D. Temple Lang und MD Ward DOI: 10.1080 / 00031305.2015.1077729

Verwenden spielbasierter Online-Simulationen, um das Verständnis der Schüler für praktische statistische Probleme bei der Datenanalyse in der Praxis zu verbessern Shonda Kuiper & Rodney X. Sturdivant DOI: 10.1080 / 00031305.2015.1075421

Bekämpfung des antistatistischen Denkens mit simulationsbasierten Methoden im gesamten Studienplan Nathan Tintle, Beth Chance, George Cobb, Soma Roy, Todd Swanson und Jill VanderStoep DOI: 10.1080 / 00031305.2015.1081619

Was Lehrer über den Bootstrap wissen sollten: Resampling im Undergraduate Statistics Curriculum Tim C. Hesterberg DOI: 10.1080 / 00031305.2015.1089789

Berücksichtigung statistischer Beratungsfälle in einführenden Zeitreihenkursen Davit Khachatryan DOI: 10.1080 / 00031305.2015.1026611

Entwicklung eines neuen Studiengangs für interdisziplinäre Computeranalytik: Ein qualitativer-quantitativer-qualitativer Ansatz Schottland Leman, Leanna House & Andrew Hoegh DOI: 10.1080 / 00031305.2015.1090337

Von den Curriculum-Richtlinien zu den Lernergebnissen: Bewertung auf Programmebene Beth Chance & Roxy Peck DOI: 10.1080 / 00031305.2015.1077730

Programmbewertung für einen Bachelor-Statistik-Major Allison Amanda Moore und Jennifer J. Kaplan DOI: 10.1080 / 00031305.2015.1087331

whuber
quelle
3
(+1) Ich denke, das ist eine großartige Antwort. Das Problem beim Unterrichten der Wahrscheinlichkeitstheorie besteht zunächst darin, dass der Eindruck entsteht, dass sich die Statistik mit der Spezifikation, Anpassung und Diagnose probabilistischer Modelle befasst. Dies ist nicht nur ein kleiner Teil der Statistik, sondern überspringt auch einige der grundlegendsten Fragen, wenn es um Daten geht: wie man sie visualisiert und wie man sie zusammenfasst. Was sind die relativen Vorteile von Mittelwert oder Median, um die Position eines Datensatzes zu identifizieren? Wie sollen wir unsere Ergebnisse kreuztabellieren? Welche Grafiken sind geeignet und was sagen sie über die Daten aus?
Silverfish
@Silverfish, es ist so anders als bei Leuten wie Bernoulli, die an Statistiken herangehen. Werfen Sie einen Blick auf dieses schöne Papier von seinem Versuch, die durch Pocken verursachte Sterblichkeit und die Vorteile der Impfung neu zu analysieren, um sie zu verhindern . Damit begann er im Grunde die moderne Epidemiologie. Wenn er auf die Dinge fixiert wäre, die Sie erwähnen, wie Visualisierung usw., hätte er keinen Einblick in das Verständnis des zugrunde liegenden Prozesses gebracht.
Aksakal
2π
Für frühe Durchbrüche in der Epidemiologie werde ich Ihnen John Snow's Studie über den Cholera-Ausbruch in der Broad Street von 1854 vorstellen - etwas, das in vielen guten Büchern zu Datenvisualisierung und den Denkprozessen zu finden ist, für die Stats 101 mit Sicherheit von zentraler Bedeutung sein muss.
Silverfish
1
@Aksakal Ich freue mich über Ihre Erwähnung von Bernoulli. Die Herangehensweise und Lösung von Problemen durch Pioniere und große Mathematiker ist jedoch eine ganz andere Sache als die, wie die Lösungen vermittelt werden sollten. Ich möchte betonen, dass niemand (afaik) befürwortet , Wahrscheinlichkeit nicht zu lehren: Die Frage ist, wann solche Ideen in den Einführungslehrplan (College) aufgenommen werden sollten und inwieweit sie verfolgt werden sollten. Es gibt starke pädagogische Gründe (sowohl in der Psychologie als auch in der Lehre begründet), viele statistische Ideen zuerst einzuführen.
Whuber
7

Die Mehrzahl der Anekdoten sind keine Daten, aber in fast jedem Fall, den ich gesehen habe, kommen zumindest die Grundlagen der Wahrscheinlichkeit vor der Statistik.

Andererseits wurden historisch gewöhnliche kleinste Quadrate entwickelt, bevor die Normalverteilung entdeckt wurde! Die statistische Methode stand an erster Stelle, die strengere, wahrscheinlichkeitsbasierte Begründung, warum es funktioniert, an zweiter Stelle!

Stephen Stiglers Statistikgeschichte: Messung der Unsicherheit vor 1900 führt den Leser durch die historische Entwicklung:

  • Mathematiker, Astronomen verstanden die Grundmechanik und das Gravitationsgesetz. Sie könnten die Bewegung von Himmelskörpern als Funktion mehrerer Parameter beschreiben.
  • Sie hatten auch Hunderte von Beobachtungen der Himmelskörper, aber wie sollten die Beobachtungen kombiniert werden, um die Parameter wiederzugewinnen?
    • Hundert Beobachtungen ergeben einhundert Gleichungen, aber wenn nur drei Unbekannte zu lösen sind, ist dies ein überbestimmtes System ...
  • Legendre war der erste, der eine Methode zur Minimierung der Summe der quadratischen Fehler entwickelte. Später war dies mit der Arbeit in Wahrscheinlichkeit von Gauß und Laplace verbunden, dass gewöhnliche kleinste Quadrate in gewissem Sinne bei normalverteilten Fehlern optimal waren.

Warum rufe ich das auf?

Es ist eine gewisse logische Eleganz, zuerst die mathematische Maschinerie aufzubauen, die erforderlich ist, um eine Methode abzuleiten, zu verstehen und den Grundstein zu legen, bevor Sie das Haus bauen.

In der Realität der Wissenschaft steht das Haus jedoch oft an erster Stelle, die Grundlage an zweiter Stelle: P.

Ich würde gerne Ergebnisse aus der Bildungsliteratur sehen. Was ist effektiver für den Unterricht? Was dann warum? Oder warum dann was?

(Ich mag ein Verrückter sein, aber ich fand die Geschichte, wie die kleinsten Quadrate entwickelt wurden, als aufregenden Seitenwender! Geschichten können ansonsten langweiliges, abstraktes Zeug zum Leben erwecken ...)

Matthew Gunn
quelle
2
Die statistische Bildungsliteratur scheint zu diesem Thema konsistent und eindeutig zu sein: Wahrscheinlichkeit ist keine Statistik, Statistik ist weit mehr als Wahrscheinlichkeit, und Statistik (zumindest auf der K-12- und College-Ebene) sollte als Denken mit Daten und nicht als Denken eingeführt werden eine Anwendung der Wahrscheinlichkeit. Lesen Sie neben den Referenzen, die ich in meiner Antwort angegeben habe, auch einige andere frei verfügbare Ressourcen wie CauseWeb , GAISE und J. Statistics Education .
Whuber
4

Ich denke, es sollte ein iterativer Prozess für die meisten Menschen sein: Man lernt ein bisschen Wahrscheinlichkeit, dann ein bisschen Statistik, dann ein bisschen mehr Wahrscheinlichkeit und ein bisschen mehr Statistik usw.

Schauen Sie sich zum Beispiel die PhD Stat-Anforderungen an der GWU an. Der PhD Level Wahrscheinlichkeitskurs 8257 enthält die folgende kurze Beschreibung:

STAT 8257. Probability. 3 Credits.
Probabilistic foundations of statistics, probability distributions, random variables, moments, characteristic functions, modes of convergence, limit theorems, probability bounds. Prerequisite: STAT 6201– STAT 6202, knowledge of calculus through functions of several variables and series.

Beachten Sie, wie es Master-Statistikkurse 6201 und 6202 in den Voraussetzungen hat. Wenn Sie einen Drilldown zum Statistik- oder Wahrscheinlichkeitskurs der niedrigsten Stufe in der GWU durchführen, gelangen Sie zu Einführung in die Unternehmens- und Wirtschaftsstatistik 1051 oder Einführung in die Statistik in den Sozialwissenschaften 1053 . Hier ist die Beschreibung zu einem von ihnen:

STAT 1051. Introduction to Business and Economic Statistics. 3 Credits.
Lecture (3 hours), laboratory (1 hour). Frequency distributions, descriptive measures, probability, probability distributions, sampling, estimation, tests of hypotheses, regression and correlation, with applications to business.

Beachten Sie, dass der Kurs den Titel "Statistik" hat, aber eine Wahrscheinlichkeit enthält. Für viele ist es die erste Begegnung mit der Wahrscheinlichkeitstheorie nach dem "Stats" -Kurs der High School.

Dies ist etwas ähnlich wie es zu meiner Zeit gelehrt wurde: Die Kurse und Lehrbücher hatten normalerweise den Titel "Wahrscheinlichkeitstheorie und mathematische Statistik", z . B. Gmurmans Text .

Ich kann mir nicht vorstellen, Wahrscheinlichkeitstheorie ohne irgendetwas zu studieren. Der PhD-Level-Kurs über 8257 setzt voraus, dass Sie bereits über Statistiken verfügen. Selbst wenn Sie die Wahrscheinlichkeitsrechnung zum ersten Mal unterrichten, ist ein gewisses Lernen der Statistik erforderlich. Nur für den ersten Kurs ist es wahrscheinlich sinnvoll, ein bisschen mehr über Statistik abzuwägen und damit auch die Wahrscheinlichkeitstheorie einzuführen.

Am Ende ist es ein iterativer Prozess, wie ich am Anfang beschrieben habe. Und wie bei jedem guten iterativen Prozess spielt der erste Schritt keine Rolle, ob das erste Konzept aus Statistiken stammt oder ob die Wahrscheinlichkeit nach mehreren Iterationen keine Rolle spielt: Sie gelangen unabhängig davon an dieselbe Stelle.

Schlussbemerkung: Der Unterrichtsansatz hängt von Ihrem Fach ab. Wenn Sie Physik studieren, bekommen Sie Dinge wie Statistikmechanik, Fermi-Dirac-Statistik, mit denen Sie sich in den Sozialwissenschaften nicht befassen werden. Auch in der Physik sind die häufig vorkommenden Ansätze natürlich, und tatsächlich beruhen sie auf einigen fundamentalen Theorien. Daher ist es sinnvoll, frühzeitig eine eigenständige Wahrscheinlichkeitstheorie zu unterrichten, im Gegensatz zu den Sozialwissenschaften, in denen es möglicherweise wenig sinnvoll ist, Zeit damit zu verbringen und stattdessen die Statistik stärker zu belasten.

Aksakal
quelle
2
Auf den ersten Blick scheint ein Promotionscurriculum nur wenig Anleitung zum Unterrichten eines Fachs für Studierende zu geben. Die Ziele und das Publikum sind völlig unterschiedlich. Ich möchte noch eine persönliche Anmerkung hinzufügen: In meinen Gesprächen mit einigen etablierten Statistikabteilungen habe ich gesehen, dass der Lehrplan 30-jährige Ideen der Pädagogik und des Fortschritts widerspiegelt und dies auch weiterhin tun wird, bis eine neue Generation von Professoren das Amt übernimmt. Vielleicht sollten wir der Verwendung eines solchen Lehrpläne als normative Modelle von chary sein , was sollte getan werden.
Whuber
1
@whuber Und dann wird der Lehrplan dann 30 Jahre alte Ideen widerspiegeln ... aber zumindest werden sie keine 60 Jahre alten Ideen sein. Jedenfalls schreitet die Wissenschaft, wie gesagt, von Begräbnis zu Begräbnis voran.
Mark L. Stone