Ich habe während meiner Schulzeit und an der Universität genug Kurse über Statistik gehabt. Ich habe ein gutes Verständnis für die Konzepte wie CI, p-Werte, Interpretation der statistischen Signifikanz, Mehrfachtests, Korrelation, einfache lineare Regression (mit kleinsten Quadraten) (allgemeine lineare Modelle) und alle Hypothesentests. Ich war in den früheren Tagen größtenteils mathematisch eingeführt worden. Und in letzter Zeit habe ich mit Hilfe des Buches Intuitive Biostatistik ein beispielloses Verständnis für die eigentliche konzeptuelle Theorie gewonnen, glaube ich.
Was mir jetzt fehlt, ist das Verständnis der Anpassungsmodelle (Schätzen von Parametern an das Modell) und dergleichen. Insbesondere Konzepte wie die Schätzung der maximalen Wahrscheinlichkeit, verallgemeinerte lineare Modelle und Bayes'sche Ansätze zur Inferenzstatistik scheinen mir immer fremd zu sein. Es gibt nicht genügend Beispiele oder Tutorials oder konzeptionell fundierte, wie man sie bei einfachen Wahrscheinlichkeitsmodellen oder anderen (grundlegenden) Themen im Internet finden würde.
Ich bin Bioinformatiker und arbeite an RNA-Seq-Daten, die sich mit rohen Lesezahlen befassen, um beispielsweise die Genexpression (oder die differentielle Genexpression) zu finden. Selbst wenn ich mit statistischen Modellen nicht vertraut bin, kann ich aus meinem Hintergrund den Grund für eine Annahme der Poissonverteilung und negative Binome usw. erfassen. Einige Artikel befassen sich jedoch mit verallgemeinerten linearen Modellen und schätzen eine MLE usw. Ich glaube, ich habe den notwendigen Hintergrund, um zu verstehen.
Ich denke, was ich verlange, ist ein Ansatz, den einige Experten unter Ihnen für nützlich halten, und (a) Bücher, die mir helfen, diese Konzepte auf intuitivere Weise zu verstehen (nicht nur strenge Mathematik, sondern Theorie, die mit Mathematik unterstützt wird). Da ich sie meistens anwenden werde, wäre ich (im Moment) zufrieden damit zu verstehen, was was ist, und später kann ich auf strenge mathematische Beweise zurückgreifen ... Hat jemand irgendwelche Empfehlungen? Es macht mir nichts aus, mehr als ein Buch zu kaufen, wenn die Themen, nach denen ich gefragt habe, tatsächlich verstreut sind, um in einem Buch behandelt zu werden.
Vielen Dank!
Antworten:
Sie finden alles Nicht-Bayesianische, was Sie danach gefragt haben. Frank Harrells Regressionsmodellierungsstrategien . Ich würde Bayes'sche Empfehlungen sachkundigeren Leuten überlassen (obwohl ich Gelman, Carlin, Stern und Rubin sowie Gilks, Richardson und Speigelhalter in meinem Bücherregal habe). Es sollten einige Bayesianische Biostatbücher auf dem Markt sein.
Update: McCullach and Nelder (1989) ist natürlich ein klassisches Buch über GLMs. Es war bahnbrechend für seine Zeit, aber ich finde es ehrlich gesagt ziemlich langweilig. Außerdem werden spätere Ergänzungen wie Restdiagnosen, Modelle ohne Inflation oder mehrstufige / hierarchische Erweiterungen nicht behandelt. Hardin und Hilbe (2007) behandeln einige dieser neueren Dinge ausführlich mit praktischen Beispielen in Stata (wo GLMs und Erweiterungen sehr gut implementiert sind; Hardin arbeitete früher bei Stata Corp. und schrieb viele dieser Befehle und trug zum Sandwich-Schätzer).
quelle
Ich würde folgende zwei Bücher empfehlen:
quelle