Folgerung für den skeptischen (aber nicht mathematisch abgeneigten) Leser

14

Ich habe gerade einen Vortrag über statistische Inferenz ("Vergleichen von Proportionen und Mitteln") gesehen, der Teil eines Online-Kurses zur Einführung in die Statistik ist. Das Material ergab für mich so wenig Sinn wie immer (inzwischen muss ich dieses Zeug Dutzende Male gesehen haben, verteilt über die letzten drei Jahrzehnte).

Ich suche ein Buch über "Basic Stats-101" (Punktschätzung, Schätzungsbewertung, statistische Inferenz, Hypothesentest, Studiendesign), das das Problem ernst nimmt, einen skeptischen Leser zu überzeugen ...

Im Folgenden gebe ich einige Beispiele für die Art der Frage, die der von mir gesuchte Autor ernst nehmen und überzeugend beantworten kann.

Aber lassen Sie mich zunächst kurz betonen, dass ich in diesem Beitrag diese Fragen nicht stelle. Bitte antworten Sie nicht! Ich gebe sie nur als Beispiele und als "Lackmus-Test" (für die Art des Autors der Suche).

Wenn ein "Anteil" einfach der Mittelwert einer booleschen Variablen ist (dh eine, die nur die Werte 0 und 1 annimmt), warum werden unterschiedliche Verfahren für die statistische Folgerung mit "Anteilen" und mit "Mitteln" gelehrt?
Wenn die Normalverteilung so robust ist, dass die Annahme von Normalität auch in Fällen, in denen diese Daten nicht ganz normal verteilt sind, gute Ergebnisse liefert, und wenn die t-Verteilung so normal aussieht, warum dann so viel Aufhebens um die Verwendung der t-Verteilung anstelle der normal?
Was genau sind "Freiheitsgrade" und warum sorgen wir uns um sie?
Was bedeutet es, vom "wahren" Wert eines Parameters zu sprechen, wenn man bedenkt, dass wir nur Verteilungen verwenden, die zufällig ähnlich wie die Daten aussehen ?
Wie kommt es, dass "explorative Datenanalyse" eine gute Sache ist, während "Datenschnüffeln" eine böse Sache ist?

Wie ich schon sagte, bin ich von der Haltung , die eine Vernachlässigung solcher Fragen impliziert , abgeschreckt . Es ist nicht die "erkenntnistheoretische Haltung", die ich in jemandem sehen möchte, der mir etwas beibringt. Ich suche Autoren, die die Skepsis und Rationalität des Lesers respektieren und wissen, wie man sie anspricht (ohne unbedingt auf Seiten und Seiten mit Formalismen und technischen Aspekten zu gehen).

Mir ist klar, dass dies eine große Herausforderung ist, und vielleicht besonders, wenn es um Statistiken geht. Daher erwarte ich nicht, dass es vielen Autoren gelungen sein wird. Aber im Moment würde ich mich damit zufrieden geben, nur einen zu finden .

Lassen Sie mich hinzufügen, dass ich nicht mathematisch abgeneigt bin. Im Gegenteil, ich liebe Mathe. (Ich bin vertraut mit Analysis, linearer Algebra, Wahrscheinlichkeitstheorie und sogar grundlegender Maßtheorie.)

Das heißt, ich interessiere mich im Moment für "angewandte", "praktische", "alltägliche" und "reale" Statistiken (im Gegensatz zu theoretischen Feinheiten). (Aber ich will auch kein Kochbuch!)

FWIW, ich habe die ersten Kapitel der Datenanalyse mit Regression und mehrstufigen / hierarchischen Modellen von Gelman und Hill gelesen , und ich mag den Ton der Autoren. Sie konzentrieren sich auf die Praxis, gehen aber bei Bedarf auf die Theorie ein. Sie treten auch häufig zurück und bewerten Standardpraktiken kritisch und bieten aufrichtige Meinungen, die den gesunden Menschenverstand eines skeptischen Lesers ansprechen. Leider haben diese Autoren kein Buch geschrieben, das sich mit dem Thema befasst, nach dem ich in diesem Beitrag frage ("Stats 101", wie oben beschrieben). Mir ist auch bekannt, dass einer dieser Autoren (Gelman) die hoch angesehene Bayes'sche Datenanalyse mitautorisiert hat , aber auch dies ist im Moment nicht das, wonach ich suche.

BEARBEITEN:

Dikran Beuteltier erhebt folgenden Einwand:

Ich glaube nicht, dass es notwendig ist, Fragen zu vernachlässigen. Es kommt ein Punkt, an dem die Beantwortung jeder Frage die Darstellung der Grundbegriffe beeinträchtigt, was oft wichtiger ist (insbesondere in einem Statistikbuch!).

Ich stimme dem zu. Ich würde genauer sagen, dass ich nach einem "zweiten Blick auf die grundlegenden Statistiken" suche. Aus diesem Grund habe ich mir die Lehrbücher angeschaut, die in Abschlusskursen zum Thema Inferenz (etwa) verwendet wurden, und festgestellt, dass sie auch Fragen vernachlässigten, wie die, die ich aufgelistet habe. Wenn überhaupt, schienen sie noch weniger geneigt zu sein, sich mit solchen Fragen zu befassen (so dass sie sich auf Dinge konzentrieren können, wie die Bedingungen für eine Konvergenz-oder-andere von diesem oder jenem ...).

Das Problem ist, dass die fortgeschritteneren Bücher an eine radikal andere Leserschaft gerichtet sind, eine, bei der die "Skepsis des Außenseiters" drastisch nachgelassen hat. IOW, diejenigen, die Absolventenstatistiken erstellen, werden von den Fragen, die mich beschäftigen, nicht mehr gestört. Sie sind nicht mehr skeptisch gegenüber all diesen Dingen. (Wie sind sie über den Skepsis-Buckel hinweggekommen? Vielleicht waren einige von ihnen überhaupt nie zu kritisch, besonders wenn sie ihre Statistiken relativ früh gelernt haben - ich weiß, dass ich selbst kein besonders kritischer Neuling war, obwohl ich es nicht getan habe Nehmen Sie dann Statistiken. Andere haben vielleicht Lehrer, die ihre Lehrbücher ausgefüllt haben. Einige waren vielleicht klug genug, um die Antworten auf solche Fragen selbst herauszufinden. Wer weiß.)

references inference point-estimation kjo
quelle

2

Die meisten dieser Fragen - die wir nicht beantworten können - haben bereits hier im Lebenslauf gute Antworten. Einige dieser Fragen haben sogar ziemlich triviale Antworten. Aber es gibt tausend Fragen, die sich die Leute zu jedem Thema stellen - Sie werden nie eine Erklärung finden, die alle möglichen Fragen abdeckt, und Sie werden auch keine finden, die nur die spezifischen Fragen vorwegnimmt, die auf Sie warten Sie haben, während Sie zuschauen oder lesen. Nun, Sie könnten ein oder zwei zufällig treffen, aber insgesamt ist es ein unmöglicher Standard. Warum nicht einfach die Fragen stellen, wenn sie auftauchen? Auf einer Site, die Fragen beantwortet?

Glen_b

2

Ich werde sagen, dass ähnliche Fragen auftauchen, wenn Leute Statistiken erstellen (und einige Bücher beantworten einige von ihnen), aber die meisten von ihnen sind keine tatsächlichen Fragen in Bezug auf Skepsis - meistens sind es einfache Verständnisfragen. ZB "Was sind Freiheitsgrade und warum interessiert es uns?" ist überhaupt nicht skeptisch, sondern verlangt nach klarer Erklärung und Motivation. Der Grund, warum fortgeschrittene Benutzer von Statistiken sich darüber keine Sorgen machen, liegt darin, dass sie bereits verstehen, warum sie so wertvoll sind.

Glen_b

6

Sie haben bereits einige gute Vorschläge. Hier sind noch ein paar mehr. Zuerst zwei Blogs, die ich sporadisch lese und in denen manchmal Fragen diskutiert werden, die Sie sich stellen. Da es sich um Blogs handelt, können Sie sogar Fragen stellen und einige sehr gute Antworten erhalten! Hier kommen Sie:

http://andrewgelman.com/ (Andrew Gelman)

http://errorstatistics.com/ (Deborah Mayo)

Und ein paar Bücher, von denen ich denke, dass sie Ihnen helfen werden: Box, Hunter & Hunter: Statistiken für Experimentatoren.

Wie der Titel schon sagt, ist dies ein ("erster", aber wirklich, wirklich ... zweiter) Kurs für Leute, die ihre eigenen Experimente entwerfen und sie so analysieren möchten. Sehr hoch im "Warum" Teil.

Dann: DR Cox: Principles of Statistical Inference, ein weiteres sehr gutes Buch über das "Warum", nicht das "Wie".

Und da Sie fragen, warum Mittel und Proportionen unterschiedlich behandelt werden, finden Sie hier ein Buch, das dies nicht tut: http://www.amazon.com/Statistics-4th-David-Freedman/dp/0393929728/ref=sr_1_1?s = books & ie = UTF8 & qid = 1373395118 & sr = 1-1 & keywords = freedman + statistics

Wenig Mathematik, viel Prinzipien.

kjetil b halvorsen
quelle

8

Ich bezweifle eher, dass es ein einziges Buch geben wird, das zu Ihnen passt, da einzelne Menschen in Bezug auf verschiedene Dinge eher skeptisch sind und Bücher eher für ein Zielpublikum als für Einzelpersonen geschrieben wurden. Dies ist eines der guten Dinge, wenn man von einer Person unterrichtet wird und nicht nur von einem Buch. Man kann also unterwegs Fragen stellen. Dies ist in einem linearen Text ziemlich schwierig.

Ich glaube nicht, dass es notwendig ist, Fragen zu vernachlässigen. Es kommt ein Punkt, an dem die Beantwortung jeder Frage die Darstellung der Grundbegriffe beeinträchtigt, was oft wichtiger ist (insbesondere in einem Statistikbuch!).

Ich vermute, der beste Ansatz ist, ein gutes Buch zu bekommen und die Antwort auf unbeantwortete Fragen an anderer Stelle nachzuschlagen. Ich habe ein Bücherregal voller Statistiktexte vor mir, einfach weil keiner für sich alles ist, was ich brauche (nicht einmal Jaynes 'Buch; o).

Für den absoluten Anfänger denke ich, dass Grant Fosters Buch "Understanding Statistics" ein guter Anfang ist, aber ich vermute, dass es in diesem Fall zu einfach ist.

Dikran Beuteltier
quelle

1

"Ich glaube nicht, dass es notwendig ist, Fragen zu vernachlässigen ..." Ich halte dies für einen fairen Einwand; Ich habe meinem Post ein EDIT hinzugefügt, um es zu beheben.

kjo

7

$X$ $\Theta$ $X\mid \Theta$ $\Theta$ $X$ $t$ $X$ $\Theta$

Zen
quelle

5

Ein großer Teil des Grundes, warum statistische Verfahren fragwürdig erscheinen, liegt darin, dass sie eher kontraintuitiv sind und eine historische Einschätzung dessen, wie die Statistik zustande gekommen ist, wahrscheinlich ein guter Ansatz für den Skeptiker ist.

Dikran Beuteltier

2

@DikranMarsupial: Tatsächlich habe ich Stiglers "Die Geschichte der Statistik" genau gelesen, um meinen Schwierigkeiten mit Statistiken auf den Grund zu gehen. Und es hat einigen geholfen. Leider bleibt der Großteil der Ära von Fisher gegen Neyman aus, als (ich vermute) ein Großteil der perversen Bizarrheit aufkam. Ich habe ungefähr 50 Seiten von Halds Buch versucht, aber es war mir unmöglich, seine Ableitungen zu verfolgen: Sie waren eindeutig an Leser mit bedeutendem statistischen Fachwissen gerichtet ist Statistik so seltsam? " würde sich gut verkaufen ... :)

kjo

4

IMHO geht die Gegenintuitivität der Statistik der Ära von Fisher gegen Neyman voraus (obwohl Intuitivität nicht Nützlichkeit impliziert oder umgekehrt). Ian Hackings Bücher sind vielleicht einen Versuch wert, ich habe "The Emergence of Probability" genossen. Ich finde Bayesianische Statistiken konzeptionell viel einfacher zu verstehen als Frequentist-Statistiken, aber in der Praxis viel schwieriger durchzuführen. Das Verständnis der Unterschiede zwischen bayesianischen und frequentistischen Ansätzen hat mir sehr geholfen, den frequentistischen Ansatz zu verstehen.

Dikran Marsupial

1

Danke, ich werde Hacking überprüfen. Seine Bücher haben mich schon lange im Visier, obwohl ich ihn nicht mehr gelesen habe, weil ich dachte, dass er sich mehr um die Philosophie der Wahrscheinlichkeitstheorie dreht (ein Thema, das mich schon fasziniert). Trotzdem erkenne ich, dass zumindest einige meiner Probleme mit der Statistik die Interpretation der Wahrscheinlichkeit betreffen. Vielleicht wird das Lesen von Hacking zumindest einige meiner Einwände beseitigen.

Kjo

2

@kjo Ich habe Hackings Logik der statistischen Folgerung gelesen und fand sie sehr "philosophisch" - er hatte die Idee der Wahrscheinlichkeit als "Unterstützung" und ging auf Neyman-Pearson zurück, hielt aber an einfachen Beispielen fest - diskutierte nicht die Störparameter, Multi -Parameter Inferenz oder irgendetwas heikles (außer ich habe es vergessen). Lesenswert, sicherlich, aber ich würde es nicht empfehlen, um damit zu beginnen.

Scortchi

6

Abelson (1995), Statistik als prinzipielles Argument ist einleitend und hat eine interessante Sicht auf einige der Fragen, die die Lernenden oft verwirren.

Aber vielleicht müssen Sie nur einige Bücher über theoretische Statistiken lesen (alles über Konvergenz, metrische Räume usw. überspringen), und selbst wenn sie keine spezifischen Fragen wie Ihre Beispiele beantworten, können Sie die meisten beantworten Sie selbst und schauen Sie den Rest nach, wie @Dikran vorschlägt.

Ich habe in einem anderen Thread Cox & Hinkley, Theoretical Statistics oder Cox, Principles of Statistical Inference zusammen mit Casella & Berger, Statistical Inference , vorgeschlagen, um die verschiedenen Perspektiven zu verstehen.

Scortchi - Wiedereinsetzung von Monica
quelle

1

Ich fand es interessant, glaube aber nicht, dass es das vom OP erwartete Niveau erreicht.

Gala

@Gael Du hast wahrscheinlich recht, vor allem im Hinblick auf die Bearbeitung.

Scortchi

Folgerung für den skeptischen (aber nicht mathematisch abgeneigten) Leser

Antworten: