Was ist das einflussreichste Buch, das jeder Statistiker lesen sollte?

77

Wenn Sie in die Vergangenheit reisen und sich sagen könnten, dass Sie zu Beginn Ihrer Karriere als Statistiker ein bestimmtes Buch lesen sollten, welches wäre das?

Neil McGuigan
quelle
1
Hier gibt es wirklich drei verschiedene Fragen! 1) Was ist das einflussreichste Buch in der Statistik? 2) Welches Buch sollte jeder Statistiker lesen? 3) Welches Buch hast du gelesen, von dem du dir am liebsten wünschtest, du würdest viel früher lesen. (2) und (3) haben wahrscheinlich eine beträchtliche Überlappung; (1) kann sehr unterschiedlich sein.
Uhr
1
Diese Frage ist eine andere Sichtweise auf diese Frage. Ich hoffe, dass es eine gute Ergänzung bietet, sobald es einige gute Antworten erhält.
Naught101

Antworten:

38

Hier sind zwei auf die Liste zu setzen:

Tufte. Die visuelle Anzeige von quantitativen Informationen
Tukey. Explorative Datenanalyse

Rob Hyndman
quelle
10
Beide sind eine regelmäßige Lektüre wert, vielleicht einmal im Jahrzehnt, um die Ideen aufzufrischen. In Bezug auf Tukey: Es ist großartig, sich ab und zu mit Bleistift und Papier hinzusetzen und eine gründliche Analyse eines interessanten Datensatzes durchzuführen.
Whuber
6
Für Grafiken für einen Statistiker bevorzuge ich die Bücher von William Cleveland gegenüber denen von Tufte.
Peter Flom
1
Ich habe das Gefühl, diese Bücher sollten nichtlineare Daten analysieren, wenn nichtlineare Methoden nicht verfügbar waren.
Robert Kubrick
34

Die Elemente des statistischen Lernens von Hastie, Tibshirani und Friedman ( http://www-stat.stanford.edu/~tibs/ElemStatLearn/) sollten sich in der Bibliothek eines jeden Statistikers befinden!

Robin Girard
quelle
6
Ich bin anderer Meinung - dass man eng mit maschinellem Lernen verbunden ist, nicht mit Statistiken an sich !
aL3xa
@ aL3xa: Es ist sicherlich auf maschinelles Lernen fokussiert. Deshalb denke ich, dass Statistiker frühzeitig darauf aufmerksam gemacht werden sollten.
Cliff AB
Anscheinend bin ich in der Minderheit, wenn ich denke, dass dieses Buch überbewertet ist. Es scheint für einen Doktoranden geschrieben worden zu sein, der sich jedoch nicht um die Details der Funktionsweise kümmert.
Der Lakonische
25

Ich bin kein Statistiker, und ich habe nicht so viel zu diesem Thema gelesen, aber vielleicht

Lady Tasting Tea: Wie die Statistik die Wissenschaft im 20. Jahrhundert revolutionierte

sollte erwähnt werden? Es ist kein Lehrbuch, aber trotzdem lesenswert.

Vivi
quelle
1
Ich unterstütze das. Es gibt auch eine Menge Vorschläge für die weitere Lektüre, die meines Erachtens im Buch nützlich sind.
Chris Beeley
1
Ich denke, dieses Buch spricht diejenigen an, die am Anfang nichts anderes wussten als die Stumpfheit der Sprache und des kulturellen Gepäcks, das mit dem Gebiet verbunden ist. Dieses Buch hat den Geist beflügelt - es besagt, dass es in der Statistik darum geht, nützliche Wahrheiten in einem Meer von Lärm und Missverständnissen zu finden.
EngrStudent
2
Viele Leute haben dies als unterhaltsam bezeichnet, aber es ist voller außergewöhnlicher Fehler. Wenn Sie es finden können, gibt meine Rezension in Biometrics 57: 1273-1274 (2001) eine alles andere als vollständige Liste. (Salsburg bringt verschiedene Bernoullis durcheinander, was einfacher ist.)
Nick Cox
21

Wahrscheinlichkeitstheorie: Die Logik der Wissenschaft

Christopher D. Long
quelle
Dieses Buch ist hart. Es geht um die Grundlagen der Wahrscheinlichkeit, und selbst in diesem Teil der Statistik halte ich es nicht für einen Referenztext. Ich glaube, dass es auf dem Planeten Erde 14 Menschen geben kann, die seine vollständige Botschaft lesen und verstehen, aber ich würde dies wahrscheinlich als ein Muss für Probabilisten einstufen, um den Tausenden anderer willen, die sich mit Dingen wie GLMs, GAMs usw. auskennen. Bayesianische Modelle und andere Dinge.
Bedeutungslos
1
Es ist auch ein bisschen traurig, dass einige der späteren Kapitel fehlen und / oder unterentwickelt sind - zum Beispiel gibt es kein Kapitel zur Regression, aber ein unveröffentlichter Manuskriptentwurf mit einigen faszinierenden Einblicken in "Messfehler" -Regressionen war verfügbar. Einige sehr coole Sachen zu Zeitreihen.
Wahrscheinlichkeitsrechnung
21

Darrell Huff - Wie man mit Statistiken lügt

Rob Hyndman
quelle
5
Damals, als dies ein Taschenbuch im Wert von 3,95 US-Dollar und dann ein Taschenbuch im Wert von 4,95 US-Dollar war , kaufte ich Dutzende Exemplare und gab sie an Freunde, Kunden und andere Interessierte weiter.
Whuber
Es ist verdientermaßen in Erinnerung geblieben. Aber der nicht-statistische Inhalt datiert es leider nicht zuletzt einen außerordentlich großen Anteil von Cartoons, in denen Menschen (und sogar Babys) rauchen. 60+ Jahre später ist das nicht mehr amüsant. (Einige Nachdrucke, z. B. einer in Großbritannien, haben die Cartoons aktualisiert.)
Nick Cox
14

Kein Buch, aber ich habe kürzlich einen Artikel von Jacob Cohen im amerikanischen Psychologen mit dem Titel "Dinge, die ich (bisher) gelernt habe" entdeckt. Es ist als PDF verfügbar hier .

Freya Harrison
quelle
Das ist ein wunderbarer Artikel, geschrieben in Cohens klarem und gesprächigem Stil.
Richiemorrisroe
12

Vor langer Zeit löste Jack Kiefers kleine Monographie "Introduction to Statistical Inference" das Geheimnis vieler klassischer Statistiken und half mir, mit dem Rest der Literatur zu beginnen. Ich beziehe mich immer noch darauf und empfehle es starken Schülern in Statistikkursen des zweiten Jahres wärmstens.

Rob Hyndman
quelle
2
Tolle Empfehlung, danke - ich habe kürzlich ein Exemplar davon bekommen und es ist wirklich ziemlich gut.
ars
1
Ich bin froh zu hören, dass jemand anderes dieses Buch schätzt!
whuber
12

Ich würde nicht argumentieren, dass eines dieser Bücher als "das einflussreichste Buch ... für Statistiker" angesehen werden sollte, aber für diejenigen, die gerade erst anfangen, sich mit dem Thema vertraut zu machen, sind zwei hilfreiche Bücher:

  1. Robert Abelson, Statistik als prinzipielles Argument
  2. Paul Murrell, Einführung in die Datentechnologie
Gung
quelle
Abelson wäre auch für viele nützlich, die nicht gerade erst anfangen.
Peter Flom
11

William Clevelands Buch "The Elements of Graphing Data" oder sein Buch "Visualizing Data"

Robert Alberts
quelle
1
Ich lese gerade The Elements durch (Visualizing Data befindet sich nicht in meiner aktuellen Schulbibliothek). Was ist der Unterschied zwischen Elements & Visualizing Data? Ich konnte nicht genügend detaillierte Beschreibungen finden, um genau den Unterschied zwischen den beiden zu formulieren.
Andy W
2
Genau. Ich denke, für Statistiker ist Cleveland besser als Tufte.
Peter Flom
3
+1 an Robert Alberts und +1 an Peter Flom (Clevelands Bücher sind definitiv besser für Statistiker, obwohl Tuftes auch schön sind und ich alle gelesen habe). @AndyW, Elements ist eine Einführung, z. B. enthält es Richtlinien zum Erstellen einer aussagekräftigen Grafik. In der Visualisierung wird gezeigt, wie Sie Ihren Datenerkundungsprozess auf Grafiken ausrichten können. Es beginnt mit der vorläufigen Visualisierung der Daten, bespricht die aktuellen Probleme und führt bis zur Bewertung des endgültigen Modells (z. B. Restanalyse) über Grafiken. Letzteres ist viel informativer als Ersteres.
Gung
@AndyW Einer von ihnen ist ein bisschen technischer als der andere (ich vergesse was was ist!)
Peter Flom
1
Wie @gung sagt, ist Visualisierung eine erweiterte Fortsetzung von Elements . Es gibt einige Überschneidungen, aber es ist eher hilfreich als ärgerlich. Beides wird dringend empfohlen. Letzte Überarbeitungstermine 1993 und 1994, aber sie sind noch 20+ Jahre später frisch. Beachten Sie, dass nicht-technische Leser von beiden profitieren würden: Ich kann persönlich bezeugen, dass Mathematik an der High School ein ausreichender Hintergrund ist.
Nick Cox
10

Ich denke, jeder Statistiker sollte Stiglers Die Geschichte der Statistik: Die Messung der Unsicherheit vor 1900 lesen

Es ist schön geschrieben, gründlich und es ist nicht die Perspektive eines Historikers, sondern eines Mathematikers, daher werden die technischen Details nicht vermieden.

Graham Cookson
quelle
6

Auf der Seite der Mathematik / Grundlagen: Harald Cramer's Mathematical Methods of Statistics .

ars
quelle
Dies ist übrigens der früheste Ort, an dem ich Cramers Phi erwähnt habe. Erstaunlich, wie eine hübsche kleine Randnotiz in diesem Buch viele Jahrzehnte später zu einer bekannten Methode wurde.
Tal Galili
5

Für eine klare Darstellung dessen, was in sozialwissenschaftlichen Zeitschriftenartikeln stehen sollte (Unterstützung beim Schreiben oder bei der Begutachtung durch Fachkollegen), mag ich den Leitfaden für Begutachter zu quantitativen Methoden in den Sozialwissenschaften . Insbesondere gefällt mir die Tabelle desideratra als Synopse des Minimums, das eine Arbeit (Artikel, Diplomarbeit, Dissertation) enthalten sollte. Die Kapitel sind nach Analysetechniken getrennt, was sehr schön ist. Ich denke, das Buch hat eine breitere Anwendung als "nur" die Sozialwissenschaften, da die behandelten Techniken in vielen Bereichen angewendet werden.

Schon sehr früh wurde ich in die Einführung von Ott in statistische Methoden und Datenanalyse eingeführt, die vielleicht nicht Gegenstand dieser Frage ist . Es ist ziemlich teuer, aber es ist eine wunderbare Ressource, um die zugrunde liegenden statistischen Modelle für verschiedene GLM-Methoden zu zeigen. Ich träume von dem Tag, an dem Zeitschriften Artikel enthalten müssen, die die Formel des getesteten statistischen Modells zeigen.

Um die Testannahmen zu überprüfen, die Auswirkungen verschiedener Optionen innerhalb eines Tests zu untersuchen und so weiter, ist dies das Buch, das ich mir während meines Studiums gewünscht hätte . Ich habe die vorherige Ausgabe und es ist eine der besten allgemeinen Ressourcen, die ich gekauft habe, da die Informationen zu den Tests klar und einheitlich angeordnet sind. Es enthält schöne Beispiele, die die Tests veranschaulichen, und erfordert nicht, dass der Leser ein bestimmtes statistisches Paket hat, um den Expositionen zu folgen.

Michelle
quelle
4

Durch Zufall von Taleb getäuscht

Taleb ist Professor an der Columbia University und Optionshändler. Er machte im Jahr 2008 ungefähr 800 Millionen Dollar mit Wetten gegen den Markt. Er schrieb auch Black Swan. Er diskutiert die Absurdität der Verwendung der Normalverteilung zur Modellierung von Märkten und philosophiert über unsere Fähigkeit, Induktion einzusetzen.

Neil McGuigan
quelle
8
Ein schreckliches Buch, geschrieben von jemandem, der Statistiken nicht versteht ...
Xi'an
4
Xi'an, möchten Sie expandieren oder Links zu einigen Kritiken bereitstellen?
Naught101
4
Es gibt eine Reihe von Kommentaren zu The Black Swan (und Taleb allgemeiner) hier
Peter Flom
4

Ich habe die obigen Empfehlungen gelesen und war überrascht, dass die meisten Personen, die die Frage beantworteten, Personen waren, die selbst keine Statistiker sind. Mit 2 oder 3 Ausnahmen ... Als Industriestatistiker, der auch zufällig mit Sozialwissenschaftlern und Angehörigen der Gesundheitsberufe zusammengearbeitet hat, würde ich sagen, wenn ich nur ein Buch auf eine einsame Insel mitnehmen könnte, wäre es George EP Box, Statistics for Experimenters (Wiley). In seinem einzigartigen humorvollen und klaren Stil erklärt er die Essenz und Philosophie des Aufbaus mathematischer Modelle für reale Daten. Strenges Denken, keine mathematischen Frivolitäten, kein Unsinn, lehrt uns, statistisch zu denken, zu zeichnen und zu visualisieren, was immer Sie können. Ein Meisterstück eines kompetenten angewandten Wissenschaftlers (Chemieingenieur zum Statistiker). Immer wieder Spaß beim Lesen.

jh
quelle
2
Gute Wahl! Sein Co-Autor, der verstorbene William Hunter und J. Stuart Hunter, trugen ebenfalls zum Buch bei.
Michael Chernick
Die erste Ausgabe ist sauberer und frischer als die zweite. Box war ein großartiger Statistiker, später jedoch ein schlechter Korrektor.
Nick Cox
3

Viele gute Bücher wurden bereits vorgeschlagen. Aber noch eines: Gerd Gigerenzers "Rechnen mit dem Risiko", denn es ist wichtiger, zu verstehen, wie Statistiken Entscheidungen beeinflussen, als die ganze Theorie richtig zu machen. Tatsächlich ist die Sünde Nummer eins der Statistiker nicht in der Lage, klar zu kommunizieren. In seinem Buch geht es um die Folgen schlechter Kommunikation und darum, wie man sie vermeidet.

Mattschwarz
quelle
"zu verstehen, wie Statistiken Entscheidungen beeinflussen, ist wichtiger, als die ganze Theorie richtig zu machen ..." Ist es nicht die Wahrheit? Ich komme aus der Architektur und kann Ihnen sagen, dass die Theorie manchmal im Weg steht ...
naught101
2

Ich werde weitermachen und ein Standardlehrbuch auf diesem Gebiet vorschlagen. Ich spreche von Wahrscheinlichkeit und Statistik von Degroot und Schervish, die erstmals 1975 veröffentlicht wurden.

Dieses Buch hat vielen Schülern als Lehrbuch gedient und gilt meiner Meinung nach zu Recht als Klassiker. Es behandelt Themen wie Kombinatorik, Verteilungen, Bayes'sche Statistik, Likelihood Inference und Regressionsanalyse. Soweit ich weiß, ist kein anderes Lehrbuch so gründlich, dass ich es für ein Muss halte.

JohnK
quelle
1

Der wesentliche Leitfaden für Effektgrößen: Statistische Aussagekraft, Metaanalyse und Interpretation von Forschungsergebnissen von Paul D. Ellis

Dieses Buch ist ein Muss für jeden, der wissenschaftliche Forschungen durchführt, insbesondere solche, die nicht aus reinen Statistiken / Mathematik stammen. Das folgende Buch erweitert das erste in Bezug auf Konfidenzintervalle.

Die neuen Statistiken verstehen: Effektgrößen, Konfidenzintervalle und Metaanalyse durch Geoff Cumming

Adam Przedniczek
quelle
1

"Am einflussreichsten" ist ein ganz anderer Begriff als "jeder sollte lesen". Ich bin nicht qualifiziert, die erste Frage zu beantworten - Sie brauchen jemanden, der ein Historiker der Statistik ist -, aber für die zweite Frage sind hier einige:

  1. Statistiken als prinzipielles Argument von Robert Abelson sollten von jedem gelesen werden, der Statistiken in den Bereichen Wissenschaft, Geisteswissenschaften usw. erstellt oder verwendet.

  2. Die beiden Bücher von William S. Cleveland über Grafik: Die Elemente der grafischen Darstellung von Daten und Visualisierung von Daten . Für Statistiker würde ich diese sogar vor Tuftes Arbeit stellen, weil Tufte sich nicht lohnt, sondern weil a) Cleveland mit Statistikern als Zielgruppe schrieb und b) Cleveland seine Empfehlungen auf experimentellen Daten darüber basierte, wie Menschen Graphen betrachten. eher als Intuition.

  3. Explorative Datenanalyse von John Tukey. Es ist veraltet, aber wertvoll - man kann viel mit Bleistift und Papier und einem Gehirn anfangen (zumindest, wenn dein Gehirn so gut ist wie das von Tukey!)

Peter Flom
quelle
1

Es wäre wahrscheinlich Bayesian Data Analysis von Gelman oder Deep Learning mit Python . Aber das ist ein bisschen so, als würde man Streptomycin ins Mittelalter bringen. Diese wurden nicht geschrieben, als ich meine Karriere begann, und einige Dinge aus den Büchern wären damals eine große Neuigkeit gewesen. Einige der einflussreichsten Dinge, die jeder wissen sollte, sind jedoch nicht aus einer Hand (vielleicht sollten sie es sein, aber ...).

Björn
quelle
0

Kennedys Leitfaden zur Ökonometrie enthält eine Fülle praktischer Ratschläge zu einem breiten Spektrum statistischer Analysen. Es ist irgendwie unglaublich informationsreich und einfach zu lesen, und ich lerne jedes Mal, wenn ich es aufgreife, etwas Neues.

Wooldridges Introductory Econometrics hat ebenfalls eine Menge von dieser Art von Diskussion, aber als einführendes Lehrbuch ist es eigenständiger. Ich wünschte, ich hätte einen Kurs dazu.

Das Lakonische
quelle