Welche Bücher bieten einen Überblick über Computerstatistiken in Bezug auf die Informatik?

15

Als Softwareentwickler interessiere ich mich für Themen wie statistische Algorithmen, Data Mining, maschinelles Lernen, Bayes'sche Netze, Klassifizierungsalgorithmen, neuronale Netze, Markov-Ketten, Monte-Carlo-Methoden und die Erzeugung von Zufallszahlen.

Ich persönlich hatte nicht das Vergnügen, an einer dieser Techniken selbst zu arbeiten, aber ich musste mit Software arbeiten, die sie unter der Haube einsetzte und auf hohem Niveau mehr über sie wissen wollte. Ich suche Bücher, die eine große Breite abdecken - eine große Tiefe ist an dieser Stelle nicht erforderlich. Ich denke, dass ich viel über Softwareentwicklung lernen kann, wenn ich die mathematischen Grundlagen der verwendeten Algorithmen und Techniken verstehe.

Kann die Community für statistische Analysen Bücher empfehlen, mit denen ich mehr über die Implementierung verschiedener statistischer Elemente in Software erfahren kann?

Thomas Owens
quelle

Antworten:

3

Vielleicht möchten Sie die äußerst beliebte Frage zum Stapelüberlauf lesen, welche Statistik ein Programmierer oder Informatiker kennen sollte .

Jeromy Anglim
quelle
Guter Anruf. Ich benutze SO und wusste nicht, dass es überhaupt eine Frage gibt. Es ist gut, eine Quervernetzung für Zeiten zu haben, in denen Fragen an mehreren Börsen auftreten können.
Thomas Owens
3

Hier ist ein sehr schönes Buch von James E. Gentle, Computational Statistics (Springer, 2009), das sowohl rechnerische als auch statistische Aspekte der Datenanalyse behandelt. Gentle hat auch andere großartige Bücher verfasst und in seinen Publikationen nachgesehen.

Ein weiteres großartiges Buch ist das Handbook of Computational Statistics von Gentle et al. (Springer, 2004); Es wird irgendwo im Web als PDF-Datei verbreitet. Schauen Sie es sich also einfach bei Google an.

chl
quelle
2

Sie haben einige ML-Techniken erwähnt, also zwei sehr schöne Bücher (leider ist mein Lieblingsbuch auf Polnisch):
http://www.amazon.com/Machine-Learning-Algorithmic-Perspective-Recognition/dp/1420067184
http: / /ai.stanford.edu/~nilsson/mlbook.html

Für numerische Dinge wie die Erzeugung von Zufallszahlen:
http://www.nr.com/

user88
quelle
+1 Das Marsland-Buch ist ziemlich gut und füllt eine große Lücke in der bestehenden Auswahl an ML-Büchern.
ars
1

Ich habe ein Exemplar von Wahrscheinlichkeitsrechnung und Statistik für Informatiker - Michael Baron zum Verkauf mit einem anderen Statistikbuch - gekauft. auch wenn es nicht perfekt war). Ich hatte noch keine Gelegenheit, es zu lesen oder daran zu arbeiten, aber es scheint ein solides Buch zu sein.

Das Vorwort des Buches besagt, dass es für Studenten der oberen Stufe und für Studienanfänger ist, und ich würde dem zustimmen. Ein gewisses Verständnis von Wahrscheinlichkeit und Statistik ist erforderlich, um den Inhalt dieses Buches zu verstehen.

Zu den Themen gehören Wahrscheinlichkeit, diskrete Zufallsvariablen, kontinuierliche Verteilungen, Monte-Carlo-Methoden, stochastische Prozesse, Warteschlangensysteme, statistische Inferenz und Regression.

Thomas Owens
quelle
1

Obwohl es sich nicht speziell um rechnergestützte Statistiken handelt, werden in einem Handbuch für statistische Analysen mit R - Brian S. Everitt und Torsten Hothorn viele Themen behandelt, die ich in Büchern über Basis- und Zwischenstatistiken gesehen habe - Inferenz, ANOVA, lineare Regression, logistische Regression, Dichteschätzung, rekursive Partitionierung, Hauptkomponentenanalyse und Clusteranalyse - unter Verwendung der R-Sprache. Dies könnte für Programmierer von Interesse sein.

Im Gegensatz zu anderen Büchern liegt der Schwerpunkt jedoch auf der Verwendung der R-Sprache, um diese statistischen Funktionen auszuführen. Andere Bücher, die ich gesehen habe, verwenden Kombinationen aus Algebra und Kalkül, um Statistiken zu demonstrieren. Dieses Buch befasst sich mit der Analyse von Daten in der R-Sprache. Und um es noch nützlicher zu machen, befinden sich die von den Autoren verwendeten Datensätze in CRAN - dem R-Repository.

Thomas Owens
quelle
1

Statistisches Rechnen mit R - Maria L. Rizzo behandelt viele Themen der Wahrscheinlichkeitsrechnung und Statistik für Informatiker - grundlegende Wahrscheinlichkeit und Statistik, Zufallsvariablen, Bayes'sche Statistik, Markov-Ketten, Visualisierung multivariater Daten, Monte-Carlo-Methoden, Permutationstests, Wahrscheinlichkeit Dichteschätzung und numerische Methoden.

Die verwendeten Gleichungen und Formeln werden sowohl als mathematische Formeln als auch im R-Code dargestellt. Ich würde sagen, dass ein grundlegendes Wissen über Wahrscheinlichkeit, Statistik, Berechnung und vielleicht diskrete Mathematik für jeden ratsam ist, der dieses Buch lesen möchte. Ein Programmierhintergrund wäre ebenfalls hilfreich, es gibt jedoch einige Referenzen für die R-Sprache, die Operatoren und die Syntax.

Thomas Owens
quelle
1

Als Computertechniker, der selbst zur Datenanalyse gekommen ist, war Programming Collective Intelligence von Toby Segaran ein wirklich lesbares Buch, das Dinge aus einer ziemlich einschüchternden und lesbaren Perspektive behandelt (auf Kosten von weniger als jedem anderen hier vorgeschlagenen Buch). Ich fand es viel zugänglicher als zum Beispiel das Buch von Bischof, das eine großartige Referenz darstellt, aber auf die Details eingeht, die Sie wahrscheinlich beim ersten Durchgang wollen. Auf Amazon: http://www.amazon.com/Programming-Collective-Intelligence-Building-Applications/dp/0596529325

user1076
quelle
1

CRAN hat einige gute Beispiele für Bücher, die sich mit statistischer Programmierung befassen. Einige von ihnen beziehen sich nicht auf maschinelles Lernen und MCMC, aber jeder Eintrag ist mit Anmerkungen versehen, sodass Sie eine ungefähre Vorstellung davon haben sollten, was jedes Buch enthält, um etwas weiter zu tauchen. http://www.r-project.org/doc/bib/R-books.html

Christopher Aden
quelle