Selbststudium gegen eine unterrichtete Ausbildung?

28

Es gibt eine Frage mit ähnlicher Absicht für Programmierer . Diese Frage hat einige recht gute Antworten, aber das allgemeine Thema scheint zu sein, dass man ohne Selbststudium nirgendwo hinkommt.

Offensichtlich gibt es einen großen Unterschied zwischen Programmieren und Statistik - beim Programmieren lernt man eigentlich nur eine grundlegende Logik und wendet sie dann wiederholt an. Neue Sprachen verwenden alle die gleichen Grundkonzepte. Das Selbststudium ermöglicht es Ihnen, fortgeschrittenere Konzepte zu erlernen und effizienter zu werden. Diese Art von Sachen ist ziemlich schwierig zu unterrichten.

Statistik ist ganz anders. Die Logik lässt sich leicht anwenden, da die Methodik in der Regel von einem anderen Benutzer festgelegt wurde. In der Tat ist die Methodik in der Regel das Meiste, was an Universitäten gelehrt wird. Aber die Statistik ist sehr viel tiefer und beinhaltet einige wirklich übergeordnete Konzepte. Es ist schwer, nach diesen Konzepten zu suchen, wenn Sie nur angewandte Statistik lernen, geschweige denn verstehen (obwohl ich mich frage, wie viel das an Fachjargon im Feld liegen kann). Ich finde auch, dass das Selbststudium in der Programmierung das Lesen einer Menge kurzer Artikel / Blogs beinhaltet, um sich mit neuen Konzepten vertraut zu machen, wohingegen zugängliche Artikel über Statistiken fast immer für den absoluten Anfänger bestimmt sind und daher für einen fortgeschrittenen Anfänger wie etwa unbrauchbar sind mich selber.

Die Frage ist also: Ist das Selbststudium für die Statistik mehr oder weniger geeignet als eine Hochschulausbildung? Welche Methoden für das Selbststudium funktionieren da? Alle Beispiele von dem, was für die Menschen zuvor gearbeitet hat, wären willkommen.

(Dies sollte wahrscheinlich ein Community-Wiki sein, aber ich sehe kein Kontrollkästchen)

naught101
quelle
@ Kardinal: auf jeden Fall. Sie antworten, dass es ausgezeichnet ist. Hoffentlich wird sich diese Frage als komplementär und nicht als Duplikat dieser Frage herausstellen.
naught101
2
Ich denke nicht, dass dies ein Duplikat ist. Ich denke, alle Antworten und viele Kommentare geben nützliche Einblicke. Prost. :)
Kardinal

Antworten:

14

Ich glaube, ich bin an einem ziemlich ähnlichen Ort, aber ich werde einen Stich machen. Ich habe als Diplom-Soziologe angefangen und bin, nachdem ich alle in meiner Abteilung verfügbaren Statistikkurse absolviert hatte, zu einigen Kursen der Statistikabteilung meiner Universität übergegangen. Es war eine Offenbarung; Die Art und Weise, wie die Statistikprofessoren mit Problemen umgingen, unterschied sich radikal von meinen Soc-Professoren - viel intuitiver und inspirierender als das, was ich zuvor gelernt hatte, viel weniger formelhaft und abhängig von vielen Dingen, die mir entweder nicht beigebracht oder nicht beigebracht worden waren. Ich habe es geschafft, in meinen grundlegenderen Kursen zu lernen. Ich musste mir wieder eine Menge Dinge beibringen, nur um mitzuhalten, und ich mache mir immer noch Sorgen, dass ich diese grundlegenden Konzepte nicht wirklich festgenagelt habe.

In den letzten vier oder fünf Jahren habe ich viel Zeit damit verbracht, viel zu lesen - Blogs, diese Site und einige herausragende Lehrbücher waren wirklich hilfreich. Aber dieses Selbstlernen hat Grenzen, von denen die größte nicht darin besteht, dass ich einige Vorlesungen in der Schule nicht absolviert habe, sondern dass es vier oder fünf Jahre her ist, dass ich eng mit jemandem zusammengearbeitet habe, der eigentlich nicht mehr wusste als ich tat. Diese Seite ist meine Hauptquelle, um meine falschen Vorstellungen zu zerstören. Das erschreckt mich bis zu dem Punkt, an dem ich mich in diesem Herbst für MS-Programme in Biostaten bewerben möchte - auf jeden Fall, um einige interessante Kurse zu belegen, aber auch, weil ich nur möchte, dass jemand meine Ideen hinterfragt und herausfindet, was ich habe wirklich gelernt.

Im Gegensatz dazu habe ich mir R über ungefähr den gleichen Zeitraum und unter den gleichen Bedingungen beigebracht. Bis ich vor ungefähr anderthalb Jahren half, eine R-Benutzergruppe zu gründen, hatte ich auch niemanden, der auf offensichtlich dumme Konstrukte in meinem Code hinwies. Aber ich habe nicht annähernd die gleiche Sorge um meinen Code, zum großen Teil, weil das Programmieren letztendlich auf die Frage hinausläuft, ob etwas funktioniert. Ich möchte die Herausforderungen dort nicht verringern - ich war lange genug bei StackOverflow, um zu wissen, dass echte Softwareentwickler über eine enorme Fachkompetenz verfügen, um etwas Elegantes, Performantes, Wartbares, Anpassbares und Leichtes zu schaffen -benutzen. Aber Software wird letztendlich danach beurteilt, wie gut sie ihre Funktion erfüllt. Wie du sagst, Statistik hat fast das umgekehrte Problem - moderne Statistik-Software macht es relativ einfach, komplexe Modelle zu entwickeln, aber in vielen Fällen haben wir keine guten Systeme, um sicherzustellen, dass diese Modelle verdammt noch mal wert sind. Es ist schwierig, viele veröffentlichte Analysen nachzubilden, und die Reproduktion zuvor veröffentlichter Studien von Grund auf ist nicht so glamourös wie das Machen neuer Entdeckungen (Anwenden von Schreckenszitaten, wie Sie es für richtig halten). Ich weiß fast immer, wann meine Programme Junk sind, aber ich bin mir nie ganz sicher, ob meine Modelle gut sind. t so glamourös wie neue Entdeckungen zu machen (Anführungszeichen anwenden, wie Sie es für richtig halten). Ich weiß fast immer, wann meine Programme Junk sind, aber ich bin mir nie ganz sicher, ob meine Modelle gut sind. t so glamourös wie neue Entdeckungen zu machen (Anführungszeichen anwenden, wie Sie es für richtig halten). Ich weiß fast immer, wann meine Programme Junk sind, aber ich bin mir nie ganz sicher, ob meine Modelle gut sind.

Also ... wie beim Programmieren halte ich das Selbstlernen für unerlässlich. Ich denke aber auch, dass es von entscheidender Bedeutung ist, einen Mentor oder Kollegen zu haben, der mit Ihnen Ideen austauscht, Sie neuem Denken aussetzt und Ihnen bei Bedarf in den Arsch tritt. Formale Bildung ist eine Möglichkeit, solche Leute zu treffen. Ob es effizient ist, hängt mehr von Ihren Umständen ab ...

Matt Parker
quelle
@ naught101 Im Nachhinein habe ich das Gefühl, ich hätte das, was du gesagt hast, aufgearbeitet. Hoffe, das ist nicht ganz der Fall ...
Matt Parker
Eine kleine Auffrischung, aber auch einige interessante Punkte :) Ihr Kommentar zur Mentorentätigkeit erinnert mich daran, dass ich im letzten Jahr zum Teil einen Programm-Mentor hatte (nicht wissenschaftsbezogen, so etwas wie ein informeller GSOC ). Das war ein äußerst nützlicher Prozess, der nicht nur mir zugute kam, da er die Entwicklung eines allgemein nützlichen Open-Source-Webframework-Codes vorantrieb. Leider habe ich Schwierigkeiten zu erkennen, wie eine solche für beide Seiten vorteilhafte Betreuung in der Statistik erfolgen kann, obwohl mein aktuelles Projekt dazu beitragen wird, eine relativ neue Modellkombinationsmethode zu testen.
naught101
13

+1 für eine gute Frage. Ich denke, auf lange Sicht wirst du dich immer auf das Selbststudium in der einen oder anderen Form verlassen müssen. Wenn Sie sich mit den Grundlagen unwohl fühlen, ist der formelle Unterricht großartig. Wenn Sie sich zum Beispiel in Bezug auf angewandte Statistiken sicher fühlen, aber keine Ahnung von der zugrunde liegenden Mathematik haben, sind mathematische Statistikkurse der richtige Weg. Aber auch dort wird es in der Grundschule letztendlich darum gehen, das Navigieren auf eigene Faust zu lernen.

Ich möchte diese Gelegenheit nutzen, um den Lebenslauf zu loben. Ich denke ehrlich, dass diese Seite die Antwort auf Ihre Bedenken sein wird. Es stimmt, dass es eine Menge Ressourcen gibt, die nicht auf das richtige Niveau ausgerichtet sind (entweder zu hoch oder zu niedrig) und dass es schwierig ist, das zu finden, was Sie brauchen. Ich vermute, dass Bücher öfter das Niveau erreichen, das für Sie am besten ist. Sie werden umfassender sein, und für jedes Thema wird es solche von fast ohne Mathematik bis zu rein theoretischen Abhandlungen mit vielen dazwischen liegenden Abstufungen geben. Sie können den Lebenslauf unter suchenund wenn Sie nichts finden, was ganz richtig ist, stellen Sie eine neue Frage. Wenn Sie sich über ein bestimmtes Konzept nicht sicher sind, fragen Sie einfach danach. Es ist unglaublich informativ, auf der Site herumzulesen und den Links zu folgen - ich bin erstaunt, wie viel ich gelernt habe, seit ich auf der Site aktiv geworden bin.

In Bezug auf bestimmte Strategien, die beim Selbststudium helfen, haben mir zwei Dinge am meisten geholfen. Erstens, mit angewandten Statistiken ist dies genau dasselbe wie beim Programmieren oder beim Üben in der Carnegie Hall. Versuchen Sie, Datensätze zu finden (möglichst in der realen Welt), und untersuchen Sie sie. Schauen Sie sich die Daten an, überlegen Sie sich, was möglicherweise passiert, passen Sie einige Modelle an und prüfen Sie, ob sie angemessen sind usw. Je mehr Sie dies tun können, desto besser wird es Ihnen. Für das Verständnis theoretischer Konzepte, die verschiedenen Techniken zugrunde liegen, ist das Simulieren das, was für mich funktioniert. Wenn ich etwas lese und es besagt, dass es auf eine bestimmte Weise funktioniert oder unter bestimmten Bedingungen zusammenbricht, schreibe ich oft einen kleinen Code, um diese Bedingungen zu erstellen und Daten aus diesem Prozess zu generieren. Dann passe ich das Modell an und speichere den relevanten Indikator , verschachtele das in einer Schleife und spiele damit. So habe ich wirklich so ziemlich alles verstanden. Ich kann über etwas lesen und es kann vollkommen klar sein - ich kann mich sogar umdrehen und es erklären - aber ich weiß es nicht wirklichHolen Sie es, bis ich es generieren und in Aktion sehen kann.

gung - Setzen Sie Monica wieder ein
quelle
2

Die theoretische Grundlage der Statistik ist zu tief, um ein gutes Verständnis des Themas zu erlangen, wenn man nur an den Problemen arbeitet, die auf Ihren Schreibtisch fallen. Einige der größten statistischen Probleme, die ich gesehen habe, stammten von Leuten mit Programmier- oder mathematischem Hintergrund, die zuversichtlich davon ausgegangen waren, dass es mit dem Wissen über Statistiken identisch ist, wie man Wahrscheinlichkeiten codiert oder berechnet.

Trotzdem gibt es keinen Grund, warum ein gut durchdachtes Selbststudienprogramm diese Aufgabe nicht erfüllen sollte. Zumindest für einige Leute: siehe das Diplom der Royal Statistical Society . Es gibt keinen Mangel an Lehrbüchern zum Lesen (& geschrieben von Cox, Berger, Tukey, Nelder & Efron!), Exzellenter kostenloser Software (R) zum Ausprobieren und natürlich Cross Validated, um Zweifel zu beseitigen.

Scortchi - Setzen Sie Monica wieder ein
quelle
1

Für die Programmierung stimme ich zu, dass das Selbststudium der richtige Weg ist. Ich habe mir R über einen Zeitraum von einigen Monaten beigebracht, als ich als Statistikerin arbeite. Ich nahm dann an einem Coursera-Kurs in R-Programmierung teil, um zu prüfen, ob ich etwas Neues lernen konnte. Da ich über einen soliden Hintergrund verfügte, habe ich es verstanden und wurde eingeladen, Assistent des Kurses zu werden.

Was die selbstlernende Statistik angeht, hängt das davon ab, aber ich würde zur Vorsicht nein sagen. Die meisten Jobs für einen Statistiker benötigen mindestens einen MSc in Statistik, nur um den Fuß in die Tür zu bekommen und aus einem bestimmten Grund. Erfahrene Statistiker haben in der Regel einen Doktortitel.

Stellen Sie sich einen Arzt vor, der Sie auffordert, ein Auswahlprogramm für eine bestimmte Behandlung zu erstellen (etwas, an dem ich gearbeitet habe). Sie greifen zur Auffrischung zu Ihren Statistikbüchern und beginnen mit der Arbeit. Sie machen einige mathematische Fehler oder Sie erkennen einige lauernde Variablen nicht und die falschen Personen werden ausgewählt. Knall! Die Angehörigen werden wegen Fahrlässigkeit angeklagt und / oder Sie befinden sich wegen Totschlags im Gefängnis.

Wenn Sie also programmieren, ist das Selbststudium der einzige Weg. Sagen Sie jedoch niemals, dass Sie Statistiken kennen oder an einem statistischen Projekt arbeiten, ohne dass Sie von einem qualifizierten und erfahrenen Statistiker betreut werden, oder fragen Sie zuerst, wofür die Ergebnisse verwendet werden sollen.

Andrew
quelle