Ich habe vor kurzem meinen Master in medizinischer und biologischer Modellierung abgeschlossen, begleitet von Ingenieurmathematik als Hintergrund. Obwohl mein Ausbildungsprogramm eine beträchtliche Anzahl von Kursen in mathematischer Statistik (siehe unten für eine Liste) enthielt, die ich mit ziemlich hohen Noten absolvierte, habe ich es häufig völlig verloren, sowohl auf Theorie als auch auf Anwendungen der Statistik zu starren. Ich muss sagen, im Vergleich zur "reinen" Mathematik macht Statistik für mich wirklich wenig Sinn. Insbesondere die Notationen und die Sprache, die von den meisten Statistikern (einschließlich meiner früheren Dozenten) verwendet werden, sind ärgerlich verworren, und fast keine der Ressourcen, die ich bisher gesehen habe (einschließlich Wikipedia), enthielt einfache Beispiele, auf die man sich leicht beziehen und die mit der angegebenen Theorie assoziieren könnte. ..
Dies ist der Hintergrund; Ich erkenne auch die bittere Realität, dass ich keine Karriere als Forscher / Ingenieur haben kann, ohne die Statistik fest im Griff zu haben, insbesondere im Bereich der Bioinformatik.
Ich hatte gehofft, dass ich ein paar Tipps von erfahreneren Statistikern / Mathematikern bekommen könnte. Wie kann ich dieses oben erwähnte Problem lösen? Kennen Sie gute Ressourcen? wie Bücher, E-Books, offene Kurse (z. B. über iTunes oder OpenCourseware) usw.
EDIT: Wie ich bereits erwähnt habe, bin ich ziemlich voreingenommen (negativ) gegenüber einem Großteil der Literatur unter dem allgemeinen Titel Statistik, und da ich nicht mehrere große (und teure) Lehrbücher pro Statistikzweig kaufen kann, würde ich das brauchen in Bezug auf ein Buch ist etwas ähnlich, was Tipler & Mosca für die Physik ist, sondern für die Statistik.
Für diejenigen, die Tipler nicht kennen; Es ist ein umfangreiches Lehrbuch, das einen Großteil der Themen abdeckt, denen man während des Hochschulstudiums begegnen könnte, und das sie jeweils von der Grundeinführung bis zu etwas tieferen Details darstellt. Im Grunde genommen ein perfektes Nachschlagewerk, das ich in meinem ersten Jahr an der Uni gekauft habe und immer noch ab und zu benutze.
Die Kurse, die ich in Statistik belegt habe:
- einen großen Einführungskurs,
- stationäre stochastische Prozesse,
- Markov-Prozesse,
- Monte-Carlo-Methoden
- Überlebensanalyse
Kennen Sie sich mit der Bayes'schen Datenanalyse (von Gelman, Carlin, Stern und Rubin) aus? Vielleicht brauchen Sie dafür eine Dosis.
quelle
Alle statistischen Probleme setzen sich im Wesentlichen aus den folgenden vier Schritten zusammen (die ich bei @whuber auf eine andere Frage ausgeliehen habe ):
Schätzen Sie den Parameter.
Bewerten Sie die Qualität dieser Schätzung.
Erforschen Sie die Daten.
Bewerten Sie die Passform.
Sie können Wortparameter mit Wort austauschenWortmodell .
Statistikbücher enthalten in der Regel die ersten beiden Punkte für verschiedene Situationen. Das Problem, dass jede reale Anwendung einen anderen Ansatz erfordert, daher ein anderes Modell, sodass ein großer Teil der Bücher diese verschiedenen Modelle katalogisiert. Dies hat den unerwünschten Effekt, dass es leicht ist, sich in den Details zu verlieren und den Überblick zu verlieren.
Das große Bilderbuch, das ich wärmstens empfehlen kann, ist die asymptotische Statistik . Es gibt eine rigorose Behandlung des Themas und ist mathematisch "rein". Obwohl der Titel die asymptotische Statistik erwähnt, ist das große Geheimnis, dass die Mehrheit der klassischen Statistikmethoden im Wesentlichen auf asymptotischen Ergebnissen basiert.
quelle
Ich denke, das Wichtigste dabei ist, eine Intuition über Statistik und einige allgemeine statistische Konzepte zu entwickeln. Vielleicht ist der beste Weg, dies zu tun, eine Domain zu haben, die Sie "besitzen" können. Dies kann zu einer positiven Rückkopplungsschleife führen, bei der Sie durch das Verständnis der Domain mehr über die zugrunde liegenden Statistiken erfahren, wodurch Sie mehr über die Domain usw. erfahren.
Für mich war diese Domain Baseballstatistik. Ich habe verstanden, dass ein Schlagmann, der in einem Spiel 3 gegen 4 geht, kein "wahrer" .750-Schlagmann ist. Dies hilft zu verstehen, dass die Beispieldaten nicht mit der zugrunde liegenden Verteilung übereinstimmen. Ich weiß auch, dass er wahrscheinlich einem durchschnittlichen Spieler näher ist als einem .750-Treffer. Dies hilft, Konzepte wie die Regression auf den Mittelwert zu verstehen. Von dort aus kann ich zu einer vollständigen Bayes'schen Folgerung gelangen, bei der meine vorherige Wahrscheinlichkeitsverteilung den Mittelwert des durchschnittlichen Baseballspielers hatte, und ich habe jetzt 4 neue Stichproben, mit denen ich meine hintere Verteilung aktualisieren kann.
Ich weiß nicht, was diese Domain für Sie ist, aber ich denke, es wäre hilfreicher als ein bloßes Lehrbuch. Beispiele helfen, die Theorie zu verstehen, was hilft, die Beispiele zu verstehen. Ein Lehrbuch mit Beispielen ist schön, aber wenn Sie diese Beispiele nicht zu "Ihren" machen können, frage ich mich, ob Sie genug davon bekommen.
quelle
Als Alternative zu Regressionsmodellierungsstrategien und für einen praktischeren Ansatz sind Angewandte Lineare Statistische Modelle aus meiner Sicht sehr gut.
quelle
Jeder lernt anders, aber ich kann mit Sicherheit sagen, dass Beispiele, Beispiele, Beispiele in der Statistik sehr hilfreich sind. Mein Vorschlag wäre, R zu lernen (nur die Grundlagen sind genug, um viel zu helfen) und dann können Sie jedes Beispiel ausprobieren, bis Ihre Augen bluten. Sie können es sortieren, anpassen, zeichnen und benennen. Und da R auf Statistik ausgerichtet ist, werden Sie beim Erlernen von R Statistik lernen. Die Bücher, die Sie aufgelistet haben, können dann unter dem Gesichtspunkt "Zeigen" angegriffen werden.
Da R kostenlos und viele Quellen kostenlos sind, müssen Sie nur Ihre Zeit investieren.
http://www.mayin.org/ajayshah/KB/R/index.html
http://math.illinoisstate.edu/dhkim/rstuff/rtutor.html
http://www.cyclismo.org/tutorial/R/
http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htm
http://www.statmethods.net/about/books.html
Es gibt viele gute Bücher über R, die Sie kaufen können. Hier ist eines, das ich verwendet habe:
http://www.amazon.com/Introductory-Statistics-R-Peter-Dalgaard/dp/0387954759
Bearbeiten ============
Ich habe vergessen, ein paar Links hinzuzufügen. Wenn Sie Windows verwenden, ist Tinn-R ein guter Editor, um R zu füttern (jemand anderes kann Links für Editoren auf einem Mac oder Linux hinzufügen).
http://www.sciviews.org/Tinn-R/
http://cran.r-project.org/web/packages/TinnR/
quelle
Ich persönlich habe das geliebt das eine wirklich gute Mischung aus Theorie und Anwendung (mit vielen Beispielen) hatte. Es war eine gute Übereinstimmung mit Casella und Berger für einen eher theorieorientierten Ansatz. Und für eine breite Pinselübersicht dies .
quelle