Als Softwareentwickler interessiere ich mich für Themen wie statistische Algorithmen, Data Mining, maschinelles Lernen, Bayes'sche Netze, Klassifizierungsalgorithmen, neuronale Netze, Markov-Ketten, Monte-Carlo-Methoden und die Erzeugung von Zufallszahlen.
Ich persönlich hatte nicht das Vergnügen, an einer dieser Techniken selbst zu arbeiten, aber ich musste mit Software arbeiten, die sie unter der Haube einsetzte und auf hohem Niveau mehr über sie wissen wollte. Ich suche Bücher, die eine große Breite abdecken - eine große Tiefe ist an dieser Stelle nicht erforderlich. Ich denke, dass ich viel über Softwareentwicklung lernen kann, wenn ich die mathematischen Grundlagen der verwendeten Algorithmen und Techniken verstehe.
Kann die Community für statistische Analysen Bücher empfehlen, mit denen ich mehr über die Implementierung verschiedener statistischer Elemente in Software erfahren kann?
quelle
Hier ist ein sehr schönes Buch von James E. Gentle, Computational Statistics (Springer, 2009), das sowohl rechnerische als auch statistische Aspekte der Datenanalyse behandelt. Gentle hat auch andere großartige Bücher verfasst und in seinen Publikationen nachgesehen.
Ein weiteres großartiges Buch ist das Handbook of Computational Statistics von Gentle et al. (Springer, 2004); Es wird irgendwo im Web als PDF-Datei verbreitet. Schauen Sie es sich also einfach bei Google an.
quelle
Sie haben einige ML-Techniken erwähnt, also zwei sehr schöne Bücher (leider ist mein Lieblingsbuch auf Polnisch):
http://www.amazon.com/Machine-Learning-Algorithmic-Perspective-Recognition/dp/1420067184
http: / /ai.stanford.edu/~nilsson/mlbook.html
Für numerische Dinge wie die Erzeugung von Zufallszahlen:
http://www.nr.com/
quelle
Ich habe ein Exemplar von Wahrscheinlichkeitsrechnung und Statistik für Informatiker - Michael Baron zum Verkauf mit einem anderen Statistikbuch - gekauft. auch wenn es nicht perfekt war). Ich hatte noch keine Gelegenheit, es zu lesen oder daran zu arbeiten, aber es scheint ein solides Buch zu sein.
Das Vorwort des Buches besagt, dass es für Studenten der oberen Stufe und für Studienanfänger ist, und ich würde dem zustimmen. Ein gewisses Verständnis von Wahrscheinlichkeit und Statistik ist erforderlich, um den Inhalt dieses Buches zu verstehen.
Zu den Themen gehören Wahrscheinlichkeit, diskrete Zufallsvariablen, kontinuierliche Verteilungen, Monte-Carlo-Methoden, stochastische Prozesse, Warteschlangensysteme, statistische Inferenz und Regression.
quelle
Obwohl es sich nicht speziell um rechnergestützte Statistiken handelt, werden in einem Handbuch für statistische Analysen mit R - Brian S. Everitt und Torsten Hothorn viele Themen behandelt, die ich in Büchern über Basis- und Zwischenstatistiken gesehen habe - Inferenz, ANOVA, lineare Regression, logistische Regression, Dichteschätzung, rekursive Partitionierung, Hauptkomponentenanalyse und Clusteranalyse - unter Verwendung der R-Sprache. Dies könnte für Programmierer von Interesse sein.
Im Gegensatz zu anderen Büchern liegt der Schwerpunkt jedoch auf der Verwendung der R-Sprache, um diese statistischen Funktionen auszuführen. Andere Bücher, die ich gesehen habe, verwenden Kombinationen aus Algebra und Kalkül, um Statistiken zu demonstrieren. Dieses Buch befasst sich mit der Analyse von Daten in der R-Sprache. Und um es noch nützlicher zu machen, befinden sich die von den Autoren verwendeten Datensätze in CRAN - dem R-Repository.
quelle
Statistisches Rechnen mit R - Maria L. Rizzo behandelt viele Themen der Wahrscheinlichkeitsrechnung und Statistik für Informatiker - grundlegende Wahrscheinlichkeit und Statistik, Zufallsvariablen, Bayes'sche Statistik, Markov-Ketten, Visualisierung multivariater Daten, Monte-Carlo-Methoden, Permutationstests, Wahrscheinlichkeit Dichteschätzung und numerische Methoden.
Die verwendeten Gleichungen und Formeln werden sowohl als mathematische Formeln als auch im R-Code dargestellt. Ich würde sagen, dass ein grundlegendes Wissen über Wahrscheinlichkeit, Statistik, Berechnung und vielleicht diskrete Mathematik für jeden ratsam ist, der dieses Buch lesen möchte. Ein Programmierhintergrund wäre ebenfalls hilfreich, es gibt jedoch einige Referenzen für die R-Sprache, die Operatoren und die Syntax.
quelle
Als Computertechniker, der selbst zur Datenanalyse gekommen ist, war Programming Collective Intelligence von Toby Segaran ein wirklich lesbares Buch, das Dinge aus einer ziemlich einschüchternden und lesbaren Perspektive behandelt (auf Kosten von weniger als jedem anderen hier vorgeschlagenen Buch). Ich fand es viel zugänglicher als zum Beispiel das Buch von Bischof, das eine großartige Referenz darstellt, aber auf die Details eingeht, die Sie wahrscheinlich beim ersten Durchgang wollen. Auf Amazon: http://www.amazon.com/Programming-Collective-Intelligence-Building-Applications/dp/0596529325
quelle
CRAN hat einige gute Beispiele für Bücher, die sich mit statistischer Programmierung befassen. Einige von ihnen beziehen sich nicht auf maschinelles Lernen und MCMC, aber jeder Eintrag ist mit Anmerkungen versehen, sodass Sie eine ungefähre Vorstellung davon haben sollten, was jedes Buch enthält, um etwas weiter zu tauchen. http://www.r-project.org/doc/bib/R-books.html
quelle