Ich habe gerade einen Vortrag über statistische Inferenz ("Vergleichen von Proportionen und Mitteln") gesehen, der Teil eines Online-Kurses zur Einführung in die Statistik ist. Das Material ergab für mich so wenig Sinn wie immer (inzwischen muss ich dieses Zeug Dutzende Male gesehen haben, verteilt über die letzten drei Jahrzehnte).
Ich suche ein Buch über "Basic Stats-101" (Punktschätzung, Schätzungsbewertung, statistische Inferenz, Hypothesentest, Studiendesign), das das Problem ernst nimmt, einen skeptischen Leser zu überzeugen ...
Im Folgenden gebe ich einige Beispiele für die Art der Frage, die der von mir gesuchte Autor ernst nehmen und überzeugend beantworten kann.
Aber lassen Sie mich zunächst kurz betonen, dass ich in diesem Beitrag diese Fragen nicht stelle. Bitte antworten Sie nicht! Ich gebe sie nur als Beispiele und als "Lackmus-Test" (für die Art des Autors der Suche).
Wenn ein "Anteil" einfach der Mittelwert einer booleschen Variablen ist (dh eine, die nur die Werte 0 und 1 annimmt), warum werden unterschiedliche Verfahren für die statistische Folgerung mit "Anteilen" und mit "Mitteln" gelehrt?
Wenn die Normalverteilung so robust ist, dass die Annahme von Normalität auch in Fällen, in denen diese Daten nicht ganz normal verteilt sind, gute Ergebnisse liefert, und wenn die t-Verteilung so normal aussieht, warum dann so viel Aufhebens um die Verwendung der t-Verteilung anstelle der normal?
Was genau sind "Freiheitsgrade" und warum sorgen wir uns um sie?
Was bedeutet es, vom "wahren" Wert eines Parameters zu sprechen, wenn man bedenkt, dass wir nur Verteilungen verwenden, die zufällig ähnlich wie die Daten aussehen ?
Wie kommt es, dass "explorative Datenanalyse" eine gute Sache ist, während "Datenschnüffeln" eine böse Sache ist?
Wie ich schon sagte, bin ich von der Haltung , die eine Vernachlässigung solcher Fragen impliziert , abgeschreckt . Es ist nicht die "erkenntnistheoretische Haltung", die ich in jemandem sehen möchte, der mir etwas beibringt. Ich suche Autoren, die die Skepsis und Rationalität des Lesers respektieren und wissen, wie man sie anspricht (ohne unbedingt auf Seiten und Seiten mit Formalismen und technischen Aspekten zu gehen).
Mir ist klar, dass dies eine große Herausforderung ist, und vielleicht besonders, wenn es um Statistiken geht. Daher erwarte ich nicht, dass es vielen Autoren gelungen sein wird. Aber im Moment würde ich mich damit zufrieden geben, nur einen zu finden .
Lassen Sie mich hinzufügen, dass ich nicht mathematisch abgeneigt bin. Im Gegenteil, ich liebe Mathe. (Ich bin vertraut mit Analysis, linearer Algebra, Wahrscheinlichkeitstheorie und sogar grundlegender Maßtheorie.)
Das heißt, ich interessiere mich im Moment für "angewandte", "praktische", "alltägliche" und "reale" Statistiken (im Gegensatz zu theoretischen Feinheiten). (Aber ich will auch kein Kochbuch!)
FWIW, ich habe die ersten Kapitel der Datenanalyse mit Regression und mehrstufigen / hierarchischen Modellen von Gelman und Hill gelesen , und ich mag den Ton der Autoren. Sie konzentrieren sich auf die Praxis, gehen aber bei Bedarf auf die Theorie ein. Sie treten auch häufig zurück und bewerten Standardpraktiken kritisch und bieten aufrichtige Meinungen, die den gesunden Menschenverstand eines skeptischen Lesers ansprechen. Leider haben diese Autoren kein Buch geschrieben, das sich mit dem Thema befasst, nach dem ich in diesem Beitrag frage ("Stats 101", wie oben beschrieben). Mir ist auch bekannt, dass einer dieser Autoren (Gelman) die hoch angesehene Bayes'sche Datenanalyse mitautorisiert hat , aber auch dies ist im Moment nicht das, wonach ich suche.
BEARBEITEN:
Dikran Beuteltier erhebt folgenden Einwand:
Ich glaube nicht, dass es notwendig ist, Fragen zu vernachlässigen. Es kommt ein Punkt, an dem die Beantwortung jeder Frage die Darstellung der Grundbegriffe beeinträchtigt, was oft wichtiger ist (insbesondere in einem Statistikbuch!).
Ich stimme dem zu. Ich würde genauer sagen, dass ich nach einem "zweiten Blick auf die grundlegenden Statistiken" suche. Aus diesem Grund habe ich mir die Lehrbücher angeschaut, die in Abschlusskursen zum Thema Inferenz (etwa) verwendet wurden, und festgestellt, dass sie auch Fragen vernachlässigten, wie die, die ich aufgelistet habe. Wenn überhaupt, schienen sie noch weniger geneigt zu sein, sich mit solchen Fragen zu befassen (so dass sie sich auf Dinge konzentrieren können, wie die Bedingungen für eine Konvergenz-oder-andere von diesem oder jenem ...).
Das Problem ist, dass die fortgeschritteneren Bücher an eine radikal andere Leserschaft gerichtet sind, eine, bei der die "Skepsis des Außenseiters" drastisch nachgelassen hat. IOW, diejenigen, die Absolventenstatistiken erstellen, werden von den Fragen, die mich beschäftigen, nicht mehr gestört. Sie sind nicht mehr skeptisch gegenüber all diesen Dingen. (Wie sind sie über den Skepsis-Buckel hinweggekommen? Vielleicht waren einige von ihnen überhaupt nie zu kritisch, besonders wenn sie ihre Statistiken relativ früh gelernt haben - ich weiß, dass ich selbst kein besonders kritischer Neuling war, obwohl ich es nicht getan habe Nehmen Sie dann Statistiken. Andere haben vielleicht Lehrer, die ihre Lehrbücher ausgefüllt haben. Einige waren vielleicht klug genug, um die Antworten auf solche Fragen selbst herauszufinden. Wer weiß.)
Antworten:
Sie haben bereits einige gute Vorschläge. Hier sind noch ein paar mehr. Zuerst zwei Blogs, die ich sporadisch lese und in denen manchmal Fragen diskutiert werden, die Sie sich stellen. Da es sich um Blogs handelt, können Sie sogar Fragen stellen und einige sehr gute Antworten erhalten! Hier kommen Sie:
http://andrewgelman.com/ (Andrew Gelman)
http://errorstatistics.com/ (Deborah Mayo)
Und ein paar Bücher, von denen ich denke, dass sie Ihnen helfen werden: Box, Hunter & Hunter: Statistiken für Experimentatoren.
Wie der Titel schon sagt, ist dies ein ("erster", aber wirklich, wirklich ... zweiter) Kurs für Leute, die ihre eigenen Experimente entwerfen und sie so analysieren möchten. Sehr hoch im "Warum" Teil.
Dann: DR Cox: Principles of Statistical Inference, ein weiteres sehr gutes Buch über das "Warum", nicht das "Wie".
Und da Sie fragen, warum Mittel und Proportionen unterschiedlich behandelt werden, finden Sie hier ein Buch, das dies nicht tut: http://www.amazon.com/Statistics-4th-David-Freedman/dp/0393929728/ref=sr_1_1?s = books & ie = UTF8 & qid = 1373395118 & sr = 1-1 & keywords = freedman + statistics
Wenig Mathematik, viel Prinzipien.
quelle
Ich bezweifle eher, dass es ein einziges Buch geben wird, das zu Ihnen passt, da einzelne Menschen in Bezug auf verschiedene Dinge eher skeptisch sind und Bücher eher für ein Zielpublikum als für Einzelpersonen geschrieben wurden. Dies ist eines der guten Dinge, wenn man von einer Person unterrichtet wird und nicht nur von einem Buch. Man kann also unterwegs Fragen stellen. Dies ist in einem linearen Text ziemlich schwierig.
Ich glaube nicht, dass es notwendig ist, Fragen zu vernachlässigen. Es kommt ein Punkt, an dem die Beantwortung jeder Frage die Darstellung der Grundbegriffe beeinträchtigt, was oft wichtiger ist (insbesondere in einem Statistikbuch!).
Ich vermute, der beste Ansatz ist, ein gutes Buch zu bekommen und die Antwort auf unbeantwortete Fragen an anderer Stelle nachzuschlagen. Ich habe ein Bücherregal voller Statistiktexte vor mir, einfach weil keiner für sich alles ist, was ich brauche (nicht einmal Jaynes 'Buch; o).
Für den absoluten Anfänger denke ich, dass Grant Fosters Buch "Understanding Statistics" ein guter Anfang ist, aber ich vermute, dass es in diesem Fall zu einfach ist.
quelle
quelle
Abelson (1995), Statistik als prinzipielles Argument ist einleitend und hat eine interessante Sicht auf einige der Fragen, die die Lernenden oft verwirren.
Aber vielleicht müssen Sie nur einige Bücher über theoretische Statistiken lesen (alles über Konvergenz, metrische Räume usw. überspringen), und selbst wenn sie keine spezifischen Fragen wie Ihre Beispiele beantworten, können Sie die meisten beantworten Sie selbst und schauen Sie den Rest nach, wie @Dikran vorschlägt.
Ich habe in einem anderen Thread Cox & Hinkley, Theoretical Statistics oder Cox, Principles of Statistical Inference zusammen mit Casella & Berger, Statistical Inference , vorgeschlagen, um die verschiedenen Perspektiven zu verstehen.
quelle