Buch für einen umfassenden und konzeptionellen Überblick über statistische Methoden

12

Ich interessiere mich sehr für das Potenzial der statistischen Analyse zur Simulation / Vorhersage / Funktionsschätzung usw.

Ich weiß jedoch nicht viel darüber und meine mathematischen Kenntnisse sind noch recht begrenzt - ich bin ein Junior-Student in Software-Engineering.

Ich bin auf der Suche nach einem Buch, das mir den Einstieg in bestimmte Dinge ermöglicht, über die ich immer wieder lese: lineare Regression und andere Arten von Regression, Bayes'sche Methoden, Monte-Carlo-Methoden, maschinelles Lernen usw. Ich möchte also auch mit R beginnen, wenn Es gab ein Buch, das beides kombinierte, das wäre großartig.

Am liebsten möchte ich, dass das Buch die Dinge konzeptionell und nicht in zu vielen technischen Details erklärt. Ich möchte, dass Statistiken für mich sehr intuitiv sind, da ich verstehe, dass Statistiken sehr viele riskante Fallstricke aufweisen.

Ich bin natürlich bereit, mehr Bücher zu lesen, um mein Verständnis für Themen zu verbessern, die ich für wertvoll halte.

Jérôme Le Chatelier
quelle

Antworten:

11
  • Vielleicht möchten Sie etwas wie Datenanalyse und Grafik mit R: Ein beispielbasierter Ansatz von John Maindonald und W. John Braun

    • Website für Buch
    • Amazon mit verschiedenen Bewertungen
    • Ich empfehle es, weil das Buch ein paar Ihrer Kästchen ankreuzt; es lehrt ein kleines R; Es bietet einen Überblick über eine Reihe verschiedener Modellierungstechniken (z. B. multiple Regression, Zeitreihen, Grafiken, verallgemeinertes lineares Modell usw.), ohne auf zu viele mathematische Details einzugehen. es ist ziemlich angewendet.
  • Ich stimme @Greg Snow zu, dass Sie besser daran denken sollten, eine Reihe verschiedener Bücher zu lesen. Zu jedem von Ihnen genannten Thema (z. B. Bayes'sche Statistik, Zeitreihen, Simulationen, R, maschinelles Lernen) gibt es gute Bücher zu diesem bestimmten Thema. Möglicherweise möchten Sie separate Fragen dazu stellen, was angesichts Ihrer besonderen Interessen an diesem Thema ein gutes Buch wäre.

  • Gute frei verfügbare Online-Optionen

    • Elements of Statistical Learning ist ein ausgezeichnetes Buch und steht sogar kostenlos online zur Verfügung. Durch Ihren Beitrag habe ich das Gefühl, dass es vielleicht ein bisschen technischer ist, als Sie zunächst möchten, aber schauen Sie sich das an und finden Sie heraus, was Sie denken. Vielleicht bist du jetzt bereit dafür; vielleicht später.
    • Benjamin Bolkers Ökologische Modelle und Daten in R sind ebenfalls gut. Es ist aus ökologischer Sicht, erklärt jedoch Simulation und Modellanpassung deutlich aus einer relativ nicht-technischen Perspektive. und es ist alles in R implementiert. Sie können all seinen R-Code auf der Website sehen. Sie können sogar die Sweave-Dokumente sehen, mit denen das Buch erstellt wurde!
    • Es gibt eine gute Liste der kostenlosen R-Dokumentation zu CRAN, wobei einige der Dokumente auch umfassendere Anweisungen zur Statistik enthalten.
Jeromy Anglim
quelle
5

Ein einziges Buch mit all diesen Themen wäre ziemlich beeindruckend und wahrscheinlich schwerer als Sie. Das ist so, als würde man nach einem einzigen Buch fragen, in dem grundlegende Programmierung, C, Java, Perl und fortgeschrittenes Datenbankdesign in einem Buch behandelt werden (eigentlich wahrscheinlich mehr, aber ich kenne nicht genug Softwareentwicklungsbegriffe, um einige fortgeschrittenere hinzuzufügen). .

Die Regression selbst ist in der Regel mindestens ein vollständiger College-Kurs. Für die Bayes-Statistik ist ein Kurs oder zwei theoretische Kurse erforderlich, bevor der Bayes-Kurs vollständig verstanden werden kann.

Es gibt keinen schnellen und einfachen Weg zu dem, was Sie versuchen. Ich würde vorschlagen, einige gute Kurse an Ihrer Universität zu belegen und von dort aus zu arbeiten.

Es gab andere Diskussionen über gute Bücher, in denen Sie nach Ideen suchen können.

Greg Snow
quelle
Vielen Dank für Ihre Antwort. Ich versuche jedoch nicht, alles aus einem Buch herauszuholen, aber wenn ich lese, dass 50 Seiten über Regression auf jeden Fall sehr hilfreich sind, um zumindest ein vernünftiges Verständnis für dieses Thema zu
erlangen
5

Für eine Kombination von R mit vielen der von Ihnen beschriebenen Methoden, zusätzlich zu dem von Jeromy Anglim erwähnten Text von Maindonald und Braun, würde ich vorschlagen, dass Sie sich diese beiden Bücher von Julian Faraway ansehen:

Beide haben eine einigermaßen einfache Einführung in die verschiedenen Themenbereiche, wobei letztere eine breite Palette moderner Regressionsansätze abdeckt, einschließlich vieler Techniken des maschinellen Lernens, jedoch schneller und mit weniger Beschreibung, und beide veranschaulichen die Techniken über R-Code.

Sie können einen Code aus dem Bereich " Bücher" der R-Website herunterladen , um 20% des UVP zu erhalten, wenn Sie direkt bei Chapman & Hall / CRC Press einkaufen. Überprüfen Sie jedoch den Amazon-Preis oder einen ähnlichen Preis für Ihre Region, da die Ermäßigung bei Amazon häufig wettbewerbsfähig ist mit dem des Verlagspreises nach Abzug des Rabatts.

Eines der guten Dinge an diesem Buchpaar ist, dass es Ihnen einen guten Einblick in die modernen Methoden gibt, mit genügend Details, um dann die Bereiche, die Sie genauer kennenlernen möchten, mit spezielleren Texten zu erkunden.

Einige der in diesen Büchern enthaltenen Inhalte sind in einem Online-PDF von Julian über den Abschnitt " Beigetragene Dokumente " auf der R-Website verfügbar . Ich empfehle Ihnen, diesen Abschnitt zu durchsuchen, um festzustellen, ob es andere Dokumente gibt, mit denen Sie möglicherweise loslegen können, ohne dass Sie Bargeld bezahlen müssen. Eine frühe Version des Textes, der in die erste Ausgabe von Maindonalds und Brauns Text überging, befindet sich ebenfalls in diesem Abschnitt.

Setzen Sie Monica - G. Simpson wieder ein
quelle
3

Wenn Sie sich einen Überblick über die meisten statistischen Methoden und deren R-Code verschaffen möchten, können Sie mit Venables und Ripleys Modern Applied Statistics in S nichts falsch machen .

Seine Succint, klar und hat genug R-Code, um Sie auf so ziemlich jedem statistischen Thema zu starten, das Sie benennen möchten.

Ich habe dieses Buch gekauft und war im Hinblick auf den Preis und die Anzahl der Seiten vorsichtig, aber die Investition hat sich gelohnt. Sie gehen von Kalkül und linearer Algebra aus, aber wenn Sie Ingenieur sind, sollte das kein allzu großes Problem sein.

Ihre S-Programmierung ist auch wunderbar, aber wahrscheinlich nicht das, wonach Sie gerade suchen.

richiemorrisroe
quelle
2

Elemente des statistischen Lernens können für Anfänger wenig einschüchternd sein. Ich würde die Lektüre " Einführung in das statistische Lernen mit Anwendungen in R " empfehlen , die hier kostenlos heruntergeladen werden kann -> http://www-bcf.usc.edu/~gareth/ISL/ Es wurden auch Beispiele in R ausgearbeitet am Ende jedes Kapitels.

" Maschinelles Lernen: Eine algorithmische Perspektive " von Stephen Marsland deckt auch ein breiteres Themenspektrum ab, ohne sich zu sehr mit Mathematik zu befassen.

Siddhesh
quelle
1

Die vorherigen Antworten haben viel mit der Anwendung zu tun. Was konzeptionelles Material und gutes statistisches Denken angeht, würde ich die Wahrscheinlichkeitstheorie empfehlen : Die Logik der Wissenschaft von Edwin Jaynes. Die ersten drei Kapitel stehen hier kostenlos zur Verfügung

Es hat jedoch nicht viel mit Computerprogrammen zu tun, so dass die Anwendungsseite auf den eher stilisierten Problemen liegt. Hat ein brillantes Kapitel über die Paradoxien der Wahrscheinlichkeitstheorie, mit einer Ausnahme, der „Marginalisierung Paradox“, das richtig aufgelöst wird hier (obwohl Jaynes im Wesentlichen „bekommt die Lektion“, dass ein unsachgemäße vor einem Grenzwert einer Folge von richtigem priors sein soll) .

Wahrscheinlichkeitslogik
quelle
2
Ich habe dieses Buch selbst geliebt, bin mir aber nicht sicher, ob es der richtige Ort ist, um eine statistische Intuition aufzubauen. Es ist ein eher polemischer und eigenwilliger Text.
Ben Lauderdale
1

Die bisher gemachten Vorschläge sind alle hervorragend, konzentrieren sich jedoch auf die fortschrittlichsten und ausgefeiltesten Techniken unter Verwendung von R-Software. Für einen exzellenten und intuitiven Überblick über klassische multivariate Techniken, das zugrunde liegende Framework für die aktuellsten Ansätze, einschließlich Regression, ANOVA, Faktoranalyse, Clusteranalyse, Diskriminanzanalyse, Kontingenztabellenanalyse und Strukturgleichungsanalyse, Dillon und Goldsteins Multivariate Statistiken, die in den 80ern von Wiley veröffentlicht wurden, sind nach wie vor ein Klassiker. Es ist klar und in seinen Beispielen angewendet, ohne übermäßig theoretisch oder mit Software verbunden zu sein.

Dillon und Goldstein ist das Buch, das ich jedem empfehlen würde, der verstehen möchte, woher moderne Methoden des maschinellen Lernens stammen.

Mike Hunter
quelle
0

Das R-Kochbuch ist eine großartige Möglichkeit, in R einzusteigen und den Umgang damit zu erlernen. Es ist sehr praktisch, also ist es großartig, um die Sprache zu lernen, aber Sie sollten auch nach einem guten Theoriebuch Ausschau halten.

Zach
quelle