Einführung in die nichtparametrische Statistik

11

Ich habe in den letzten zwei Jahren Statistik studiert. Fast alles, was ich gelernt habe, ist über parametrische Statistiken. Jetzt möchte ich mehr über nichtparametrische Statistiken erfahren. Kann jemand eine kurze (vielleicht auch lesbare) Einführung in diesen Bereich vorschlagen?

LaTeXFan
quelle

Antworten:

12

Es hängt davon ab, was Sie unter "prägnant" verstehen, welche Art von Behandlung Sie suchen (einschließlich Mathematik vs. Konzepte und Intuition) und welche Techniken Sie einbeziehen möchten.

Ich würde dringend empfehlen, mit Büchern zu beginnen und mehr als ein Buch zu lesen .

Conovers " Praktische nichtparametrische Statistik " ist gut und eine, die ich definitiv gerne in eine Liste aufnehmen würde.

Daniels " Angewandte nichtparametrische Statistik " ist sehr gut und für seine Größe ziemlich umfassend.

Ich fand die " verteilungsfreien Tests " von Neave und Worthington sehr gut lesbar, als sie herauskamen (und in vielerlei Hinsicht immer noch). Heutzutage sieht der Code darin etwas veraltet aus, aber andererseits ist er im Allgemeinen lesbar genug, um übersetzt zu werden. Wenn Sie es finden können, ist es eine gute Einführung; Es lohnt sich, aus zweiter Hand zu kaufen, wenn Sie es nicht neu kaufen.

Es gibt Dutzende guter Bücher, einige älter als die drei, die ich erwähnt habe, andere neuer; Einige passen vielleicht besser zu Ihnen als alle anderen, die ich erwähnt habe. Ich würde mit einer Universitätsbibliothek beginnen und nach Begriffen wie in den obigen Titeln suchen und wenn möglich nachsehen, was sich in der Nähe befindet.

Lesen Sie einige davon durch und finden Sie einige, die Ihnen gefallen.

Als ich als Student Nichtparametrik machte, gab es ungefähr acht Bücher in der empfohlenen Lektüre, vielleicht mehr. Jeder einzelne von ihnen hatte etwas, was den meisten anderen fehlte. Ich bin froh, dass ich sie mir alle angesehen habe.

Glen_b - Monica neu starten
quelle
4

Wenn Ihr Studienbereich in den Soft Sciences liegt (z. B. Psychologie, Soziologie, Pädagogik), würde ich die nichtparametrische Statistik für die Verhaltenswissenschaften von Siegel und Castellan (McGraw-Hill Book Company) empfehlen . (Ich habe die zweite Ausgabe von 1988). Aus dem Vorwort:

Eine Besonderheit ist die schrittweise Beschreibung der Anwendung jedes Verfahrens auf tatsächliche Daten.

Joel Reyes Noche
quelle
2

Ich fand "Semiparametric Regression" von Carroll, Wand et al. gut lesbar sein. Es ist veraltet, aber eine gute Sache, bevor Sie zu Simon Woods prägnantem, aber dichtem Buch über GAMs übergehen.

Beide Bücher konzentrieren sich auf bestrafte Spline-Regressionsmodelle, was in nichtparametrischen Statistiken nicht alles ist. Aber wohl am nützlichsten für angewandte Menschen.

generic_user
quelle
1
20826: Zur Erklärung, nur für den Fall, dass Sie diese Antwort etwas verwirrend finden - 'nichtparametrisch' kann sich nicht nur auf eine nicht spezifizierte (möglicherweise unendlich parametrische) Funktionsform für die Verteilung beziehen (dh Sie geben keine parametrische Form für ), sondern auch für die Beziehung zwischen Variablen ( ). Die Antwort von ACD bezieht sich hier eher auf das Zweite als auf das Erste. Es ist tatsächlich möglich, dass der Begriff "nichtparametrisch" in Bezug auf Regressionsmodelle für beide Probleme oder sogar für beide gleichzeitig gilt (was ich eher als "doppelt nichtparametrisch" bezeichne). E ( Y ) = g ( x )FY(y)E(Y)=g(x)
Glen_b -Rate State Monica
Recht. Nur neugierig, was sind einige Beispiele für Fälle in angewandter Arbeit, in denen die erste der beiden Formen nichtparametrischer Arbeit nützlich sein könnte? oder ich denke der Bootstrap wäre ein Beispiel, oder?
generic_user
1
ACD, ich empfehle Ihnen, sich eines der in meinen Antworten genannten Bücher anzusehen. Ich kann - im wahrsten Sinne des Wortes - auf viele tausend Artikel verweisen, die sie auf echte Probleme anwenden, darunter Wilcoxon-Mann-Whitney-Tests, Fit-Tests wie Kolmogorov-Smirnov, Korrelationsmaße wie Kendall und Spearman, Theil-Sen-Regression , Kaplan-Meier-Überlebenskurven (und Log-Rank-Tests), Permutation / Randomisierung (+ andere Resampling-Methoden) und vieles mehr. Im Großen und Ganzen würde ich sagen, dass es tatsächlich ziemlich oft angewendet wird, als Sie es verwenden. Ja, der Bootstrap ist enthalten.
Glen_b -Rate State Monica
1
(ctd) ... die Fläche ist ziemlich groß; Wenn Sie es ein wenig eingrenzen, kann ich Ihnen wahrscheinlich einige bestimmte Anwendungen finden.
Glen_b -Reinstate Monica
1
Richtig, es sind also im Allgemeinen Tests, die nicht auf Verteilungsannahmen beruhen. Ich frage mich wohl, ob man eine nichtparametrische Verteilung für ein Modell gleichzeitig mit der Schätzung der Beziehungen zwischen Variablen (wahrscheinlich mit vielen Daten) schätzen kann. Aber wie Sie hervorheben, gibt es viel zu lesen.
generic_user
2

Ich war überrascht, dass Larry Wassermans All of Nonparametric Statistics nicht erwähnt wurde.

Ich denke, es ist ein großartiges Buch von relativ prägnanter Größe. Insbesondere wenn jemand bereits einen Hintergrund in der parametrischen Statistik hat, bietet dieses Buch einen sehr neuen Blick auf " statistische Methoden, die darauf abzielen, die Anzahl der zugrunde liegenden Annahmen so schwach wie möglich zu halten ". Ich fand es weniger wortreich als andere Einführungs- / Grundierungsbücher; Dies kann je nach Vorlieben eine gute oder eine schlechte Sache sein. Das einzige "Delta", das dieses Buch hat, ist, dass es Rangtests nicht wirklich abdeckt.

usεr11852
quelle
(+1) Es scheint, dass Wassermans Buch "All of Statistics" auch eine, wenn auch kürzere, Behandlung der nichtparametrischen Statistik enthält. Sowohl diese als auch viele andere Bücher sind nett, aber meiner Meinung nach ein Overkill für angewandte Forscher / Wissenschaftler bis zu einem gewissen Grad. Sicher, es wird nicht schaden, alle Theoreme und Beweise zu kennen, aber das ist angesichts der zeitlichen und räumlichen Einschränkungen eher ein "nice to have" als ein "must have". Ich bin noch nicht in der Lage, ausgewogene statistische Bücher für angewandte Wissenschaftler zu finden (das heißt, streng genug, ohne zu tief in Details zu gehen, und aus Anwendungssicht nützlich).
Aleksandr Blekh