Ich interessiere mich sehr für das Potenzial der statistischen Analyse zur Simulation / Vorhersage / Funktionsschätzung usw.
Ich weiß jedoch nicht viel darüber und meine mathematischen Kenntnisse sind noch recht begrenzt - ich bin ein Junior-Student in Software-Engineering.
Ich bin auf der Suche nach einem Buch, das mir den Einstieg in bestimmte Dinge ermöglicht, über die ich immer wieder lese: lineare Regression und andere Arten von Regression, Bayes'sche Methoden, Monte-Carlo-Methoden, maschinelles Lernen usw. Ich möchte also auch mit R beginnen, wenn Es gab ein Buch, das beides kombinierte, das wäre großartig.
Am liebsten möchte ich, dass das Buch die Dinge konzeptionell und nicht in zu vielen technischen Details erklärt. Ich möchte, dass Statistiken für mich sehr intuitiv sind, da ich verstehe, dass Statistiken sehr viele riskante Fallstricke aufweisen.
Ich bin natürlich bereit, mehr Bücher zu lesen, um mein Verständnis für Themen zu verbessern, die ich für wertvoll halte.
quelle
Für eine Kombination von R mit vielen der von Ihnen beschriebenen Methoden, zusätzlich zu dem von Jeromy Anglim erwähnten Text von Maindonald und Braun, würde ich vorschlagen, dass Sie sich diese beiden Bücher von Julian Faraway ansehen:
Beide haben eine einigermaßen einfache Einführung in die verschiedenen Themenbereiche, wobei letztere eine breite Palette moderner Regressionsansätze abdeckt, einschließlich vieler Techniken des maschinellen Lernens, jedoch schneller und mit weniger Beschreibung, und beide veranschaulichen die Techniken über R-Code.
Sie können einen Code aus dem Bereich " Bücher" der R-Website herunterladen , um 20% des UVP zu erhalten, wenn Sie direkt bei Chapman & Hall / CRC Press einkaufen. Überprüfen Sie jedoch den Amazon-Preis oder einen ähnlichen Preis für Ihre Region, da die Ermäßigung bei Amazon häufig wettbewerbsfähig ist mit dem des Verlagspreises nach Abzug des Rabatts.
Eines der guten Dinge an diesem Buchpaar ist, dass es Ihnen einen guten Einblick in die modernen Methoden gibt, mit genügend Details, um dann die Bereiche, die Sie genauer kennenlernen möchten, mit spezielleren Texten zu erkunden.
Einige der in diesen Büchern enthaltenen Inhalte sind in einem Online-PDF von Julian über den Abschnitt " Beigetragene Dokumente " auf der R-Website verfügbar . Ich empfehle Ihnen, diesen Abschnitt zu durchsuchen, um festzustellen, ob es andere Dokumente gibt, mit denen Sie möglicherweise loslegen können, ohne dass Sie Bargeld bezahlen müssen. Eine frühe Version des Textes, der in die erste Ausgabe von Maindonalds und Brauns Text überging, befindet sich ebenfalls in diesem Abschnitt.
quelle
Wenn Sie sich einen Überblick über die meisten statistischen Methoden und deren R-Code verschaffen möchten, können Sie mit Venables und Ripleys Modern Applied Statistics in S nichts falsch machen .
Seine Succint, klar und hat genug R-Code, um Sie auf so ziemlich jedem statistischen Thema zu starten, das Sie benennen möchten.
Ich habe dieses Buch gekauft und war im Hinblick auf den Preis und die Anzahl der Seiten vorsichtig, aber die Investition hat sich gelohnt. Sie gehen von Kalkül und linearer Algebra aus, aber wenn Sie Ingenieur sind, sollte das kein allzu großes Problem sein.
Ihre S-Programmierung ist auch wunderbar, aber wahrscheinlich nicht das, wonach Sie gerade suchen.
quelle
Elemente des statistischen Lernens können für Anfänger wenig einschüchternd sein. Ich würde die Lektüre " Einführung in das statistische Lernen mit Anwendungen in R " empfehlen , die hier kostenlos heruntergeladen werden kann -> http://www-bcf.usc.edu/~gareth/ISL/ Es wurden auch Beispiele in R ausgearbeitet am Ende jedes Kapitels.
" Maschinelles Lernen: Eine algorithmische Perspektive " von Stephen Marsland deckt auch ein breiteres Themenspektrum ab, ohne sich zu sehr mit Mathematik zu befassen.
quelle
Die vorherigen Antworten haben viel mit der Anwendung zu tun. Was konzeptionelles Material und gutes statistisches Denken angeht, würde ich die Wahrscheinlichkeitstheorie empfehlen : Die Logik der Wissenschaft von Edwin Jaynes. Die ersten drei Kapitel stehen hier kostenlos zur Verfügung
Es hat jedoch nicht viel mit Computerprogrammen zu tun, so dass die Anwendungsseite auf den eher stilisierten Problemen liegt. Hat ein brillantes Kapitel über die Paradoxien der Wahrscheinlichkeitstheorie, mit einer Ausnahme, der „Marginalisierung Paradox“, das richtig aufgelöst wird hier (obwohl Jaynes im Wesentlichen „bekommt die Lektion“, dass ein unsachgemäße vor einem Grenzwert einer Folge von richtigem priors sein soll) .
quelle
Die bisher gemachten Vorschläge sind alle hervorragend, konzentrieren sich jedoch auf die fortschrittlichsten und ausgefeiltesten Techniken unter Verwendung von R-Software. Für einen exzellenten und intuitiven Überblick über klassische multivariate Techniken, das zugrunde liegende Framework für die aktuellsten Ansätze, einschließlich Regression, ANOVA, Faktoranalyse, Clusteranalyse, Diskriminanzanalyse, Kontingenztabellenanalyse und Strukturgleichungsanalyse, Dillon und Goldsteins Multivariate Statistiken, die in den 80ern von Wiley veröffentlicht wurden, sind nach wie vor ein Klassiker. Es ist klar und in seinen Beispielen angewendet, ohne übermäßig theoretisch oder mit Software verbunden zu sein.
Dillon und Goldstein ist das Buch, das ich jedem empfehlen würde, der verstehen möchte, woher moderne Methoden des maschinellen Lernens stammen.
quelle
Ich würde "Time Series Analysis und seine Anwendungen mit R-Beispielen" von Shumway und Stoffer empfehlen
Die dritte Ausgabe: http://www.stat.pitt.edu/stoffer/tsa3/
Klicken und kaufen http://www.amazon.com/Time-Analysis-Its-Applications-Statistics/dp/144197864X/ref=dp_ob_title_bk
quelle
Das R-Kochbuch ist eine großartige Möglichkeit, in R einzusteigen und den Umgang damit zu erlernen. Es ist sehr praktisch, also ist es großartig, um die Sprache zu lernen, aber Sie sollten auch nach einem guten Theoriebuch Ausschau halten.
quelle