Kann mir jemand erklären, warum jemand für Hypothesentests oder Regressionsanalysen eine parametrische Methode einer nichtparametrischen statistischen Methode vorziehen sollte?
In meinen Augen ist es wie beim Rafting und bei der Auswahl einer nicht wasserfesten Uhr, weil Sie sie möglicherweise nicht nass bekommen. Warum nicht das Tool verwenden, das bei jeder Gelegenheit funktioniert?
Antworten:
Selten, wenn überhaupt, haben ein parametrischer Test und ein nicht parametrischer Test tatsächlich dieselbe Null. Der parametrische Test testet den Mittelwert der Verteilung, vorausgesetzt, die ersten beiden Momente existieren. Der Wilcoxon-Rang-Summen-Test nimmt keine Momente an und testet stattdessen die Verteilungsgleichheit. Sein impliziter Parameter ist eine seltsame Funktion der Verteilungen, die Wahrscheinlichkeit, dass die Beobachtung von einer Probe niedriger ist als die Beobachtung von der anderen. Sie können sich über Vergleiche zwischen den beiden Tests unter der vollständig angegebenen Null identischer Verteilungen unterhalten ... aber Sie müssen erkennen, dass die beiden Tests unterschiedliche Hypothesen testen.t
Die Informationen, die parametrische Tests zusammen mit ihrer Annahme einbringen, tragen zur Verbesserung der Leistungsfähigkeit der Tests bei. Natürlich sind diese Informationen besser richtig, aber es gibt heutzutage nur wenige Bereiche menschlichen Wissens, in denen solche vorläufigen Informationen nicht existieren. Eine interessante Ausnahme, die explizit "Ich möchte nichts annehmen" sagt, ist der Gerichtssaal, in dem nicht-parametrische Methoden nach wie vor weit verbreitet sind - und dies ist für die Anwendung durchaus sinnvoll. Laut Wortspiel gibt es wahrscheinlich einen guten Grund dafür, dass Phillip Good gute Bücher sowohl über nichtparametrische Statistiken als auch über Gerichtsstatistiken verfasst hat .
Es gibt auch Testsituationen, in denen Sie keinen Zugriff auf die für den nichtparametrischen Test erforderlichen Mikrodaten haben. Angenommen, Sie wurden gebeten, zwei Personengruppen zu vergleichen, um festzustellen, ob eine fettleibiger ist als die andere. In einer idealen Welt haben Sie Größen- und Gewichtsmessungen für alle, und Sie könnten einen Permutationstest bilden, der nach der Größe geschichtet ist. In einer weniger als idealen (dh realen) Welt haben Sie möglicherweise nur die mittlere Größe und das mittlere Gewicht in jeder Gruppe (oder einige Bereiche oder Abweichungen dieser Merkmale über den Stichprobenmitteln). Am besten berechnen Sie dann den mittleren BMI für jede Gruppe und vergleichen Sie sie, wenn Sie nur die Mittelwerte haben. oder nehmen Sie eine bivariate Norm für Größe und Gewicht an, wenn Sie Mittelwerte und Abweichungen haben (Sie müssten wahrscheinlich eine Korrelation von einigen externen Daten ziehen, wenn diese nicht mit Ihren Proben geliefert wurden),
quelle
Wie andere geschrieben haben: Wenn die Voraussetzungen erfüllt sind, ist Ihr parametrischer Test leistungsfähiger als der nichtparametrische.
In Ihrer Uhrenanalogie wäre die nicht wasserfeste wesentlich genauer, wenn sie nicht nass würde. Zum Beispiel könnte Ihre wasserfeste Uhr in beiden Fällen um eine Stunde außer Betrieb sein, wohingegen die nicht wasserfeste Uhr genau ist ... und Sie müssen nach Ihrer Rafting-Fahrt einen Bus nehmen. In diesem Fall ist es möglicherweise sinnvoll, die nicht wasserfeste Uhr mitzunehmen und sicherzustellen, dass sie nicht nass wird.
Bonuspunkt: Nichtparametrische Methoden sind nicht immer einfach. Ja, ein alternativer Permutationstest zu at test ist einfach. Eine nichtparametrische Alternative zu einem gemischten linearen Modell mit mehreren bidirektionalen Wechselwirkungen und verschachtelten Zufallseffekten ist jedoch wesentlich schwieriger einzurichten als ein einfacher Aufruf
nlme()
. Ich habe dies unter Verwendung von Permutationstests getan, und meiner Erfahrung nach waren die p-Werte von Parametertests und Permutationstests immer ziemlich nahe beieinander, selbst wenn Residuen aus dem parametrischen Modell nicht normal waren. Parametrische Tests sind oft überraschend widerstandsfähig gegen Abweichungen von ihren Voraussetzungen.quelle
Ich stimme zu, dass in vielen Fällen nichtparametrische Techniken günstig sind, aber es gibt auch Situationen, in denen parametrische Methoden nützlicher sind.
Konzentrieren wir uns auf die Diskussion "Zwei-Stichproben-T-Test gegen Wilcoxons Rang-Summen-Test" (ansonsten müssen wir ein ganzes Buch schreiben).
quelle
Beim Testen von Hypothesen werden bei nichtparametrischen Tests häufig verschiedene Hypothesen getestet. Dies ist ein Grund, warum man nicht immer nur einen nichtparametrischen Test durch einen parametrischen Test ersetzen kann.
Im Allgemeinen bieten parametrische Prozeduren die Möglichkeit, ansonsten unstrukturierten Problemen Struktur zu verleihen. Dies ist sehr nützlich und kann als eine Art vereinfachende Heuristik angesehen werden, anstatt zu glauben, dass das Modell buchstäblich wahr ist. Nehmen wir zum Beispiel das Problem der Vorhersage einer kontinuierlichen Antwort auf der Grundlage eines Vektors von Prädiktoren Verwendung einer Regressionsfunktion (selbst wenn eine solche Funktion existiert, ist dies eine Art parametrische Einschränkung). Wenn wir absolut nichts über annehmeny x f f dann ist überhaupt nicht klar, wie wir bei der Schätzung dieser Funktion vorgehen könnten. Die Menge der möglichen Antworten, nach denen wir suchen müssen, ist einfach zu groß. Wenn wir jedoch den Raum möglicher Antworten auf (zum Beispiel) die Menge der linearen Funktionen , können wir tatsächlich Fortschritte . Wir brauchen nicht zu glauben , dass das Modell genau hält, sind wir nur eine Annäherung zu machen aufgrund der Notwendigkeit an ankommt einig Antwort, aber unvollkommen.f(x)=∑pj=1βjxj
quelle
Semiparametrische Modelle haben viele Vorteile. Sie bieten Tests wie den Wilcoxon-Test als Sonderfall an, ermöglichen jedoch die Schätzung von Wirkungsgraden, Quantilen, Mittelwerten und Überschreitungswahrscheinlichkeiten. Sie erstrecken sich auf longitudinale und zensierte Daten. Sie sind robust im Y-Raum und transformationsinvariant mit Ausnahme von Schätzmitteln. Ein detailliertes Beispiel / Fallbeispiel finden Sie unter http://biostat.mc.vanderbilt.edu/rms .
Im Gegensatz zu vollständig parametrischen Methoden ( Test, gewöhnliche multiple Regression, Mischeffektmodelle, parametrische Überlebensmodelle usw.) gehen semiparametrische Methoden für ordinales oder kontinuierliches nicht von der Verteilung von für ein gegebenes , auch nicht von der Verteilung von Verteilung ist unimodal oder glatt. Die Verteilung kann sogar starke Spitzen innerhalb oder an den Grenzen aufweisen. Semiparametrische Modelle setzen nur eine Verbindung (z. B. Exponentiation im Fall eines Cox-Modells) zwischen Verteilungen für zwei verschiedene Kovariateneinstellungen undt Y Y X X1 X2 . Beispiele sind das Proportional-Odds-Modell (Sonderfall: Wilcoxon und Kruskal-Wallis) und das Proportional-Hazards-Modell (Sonderfall: Log-Rank- und Stratified-Log-Rank-Test).
In der Tat haben semiparametrische Modelle viele Abschnitte. Diese Abschnitte codieren die Verteilung von nichtparametrisch. Dies verursacht jedoch kein Problem mit einer Überparametrisierung.Y
quelle
Unter den zahlreichen Antworten möchte ich auch auf die Bayes'schen Statistiken hinweisen. Einige Probleme können nicht allein durch Wahrscheinlichkeiten beantwortet werden. Ein Frequentist verwendet kontrafaktische Argumentation, bei der sich die "Wahrscheinlichkeit" auf alternative Universen bezieht und ein alternatives Universumsgerüst keinen Sinn ergibt, sofern daraus auf den Zustand eines Individuums geschlossen werden kann, wie z Arten, die einer massiven Umweltverschiebung ausgesetzt waren, führten zu ihrem Aussterben. Im Bayes'schen Kontext ist Wahrscheinlichkeit "Glaube", nicht Frequenz, die auf das angewendet werden kann, was bereits ausgefällt ist.
Die Mehrheit der Bayes'schen Methoden erfordert nun die vollständige Spezifizierung von Wahrscheinlichkeitsmodellen für den Prior und das Ergebnis. Die meisten dieser Wahrscheinlichkeitsmodelle sind parametrisch. Übereinstimmend mit den Aussagen anderer müssen diese nicht genau richtig sein, um aussagekräftige Zusammenfassungen der Daten zu erstellen. "Alle Modelle sind falsch, einige Modelle sind nützlich."
Es gibt natürlich nichtparametrische Bayes'sche Methoden. Diese weisen viele statistische Falten auf und erfordern im Allgemeinen, dass nahezu umfassende Bevölkerungsdaten sinnvoll verwendet werden.
quelle
Der einzige Grund, warum ich antworte, ist, dass niemand auf den Hauptgrund aufmerksam gemacht hat, warum wir parametrische Tests verwenden (zumindest bei der Analyse von Daten der Teilchenphysik). Weil wir die Parametrisierung der Daten kennen. Duh! Das ist so ein großer Vorteil. Sie reduzieren Ihre Hunderte, Tausende oder Millionen von Datenpunkten auf die wenigen Parameter, die Ihnen wichtig sind, und beschreiben Ihre Verteilung. Diese zeigen Ihnen die zugrunde liegende Physik (oder was auch immer die Wissenschaft Ihnen Ihre Daten gibt).
Wenn Sie keine Ahnung von der zugrunde liegenden Wahrscheinlichkeitsdichte haben, haben Sie natürlich keine andere Wahl: Verwenden Sie nicht parametrische Tests. Nicht-parametrische Tests haben den Vorteil, dass sie keine vorgefassten Verzerrungen aufweisen, können jedoch schwieriger zu implementieren sein - manchmal viel schwieriger.
quelle
Nichtparametrische Statistiken haben ihre eigenen Probleme! Einer von ihnen ist die Betonung auf Hypothesentests, oft brauchen wir Schätz- und Konfidenzintervalle, und es ist kompliziert, sie in komplizierten Modellen mit nichtparametrischen Merkmalen zu erhalten. Unter http://andrewgelman.com/2015/07/13/dont-do-the-wilcoxon/ gibt es einen sehr guten Blogeintrag mit Diskussion. Die Diskussion führt zu diesem anderen Beitrag, http: // notstatschat. tumblr.com/post/63237480043/rock-paper-scissors-wilcoxon-test , der für einen ganz anderen Blickwinkel auf Wilcoxon empfohlen wird . Die Kurzversion lautet: Das Wilcoxon (und andere Rangprüfungen) können zu Nichttransitivität führen.
quelle
Ich würde sagen, dass nicht parametrische Statistiken allgemeiner anwendbar sind, da sie weniger Annahmen treffen als parametrische Statistiken.
Wenn man jedoch eine parametrische Statistik verwendet und die zugrunde liegenden Annahmen erfüllt sind, ist die parametrische Statistik leistungsfähiger als die nicht parametrische.
quelle
Parametrische Statistiken sind oft Möglichkeiten, externes Wissen einzubeziehen. Sie wissen beispielsweise, dass die Fehlerverteilung normal ist, und dieses Wissen stammt entweder aus früheren Erfahrungen oder aus einer anderen Überlegung und nicht aus dem Datensatz. In diesem Fall beziehen Sie unter der Annahme einer Normalverteilung dieses externe Wissen in Ihre Parameterschätzungen ein, wodurch Ihre Schätzungen verbessert werden müssen.
Nach Ihrer Uhrenanalogie. Heutzutage sind fast alle Uhren wasserdicht, mit Ausnahme von Schmuckstücken oder ungewöhnlichen Materialien wie Holz. Der Grund, sie zu tragen, ist genau das: Sie sind etwas Besonderes. Wenn Sie Wasserdicht gemeint haben, dann sind viele Modeuhren nicht wasserdicht. Der Grund, sie zu tragen, ist wieder ihre Funktion: Sie würden keine Taucheruhr mit Anzug und Krawatte tragen. Außerdem haben heutzutage viele Uhren einen offenen Rücken, sodass Sie die Bewegung durch den Kristall beobachten können. Natürlich sind diese Uhren in der Regel nicht wasserdicht.
quelle
Dies ist kein Szenario zum Testen von Hypothesen, aber es kann ein gutes Beispiel für die Beantwortung Ihrer Frage sein: Betrachten wir die Clusteranalyse. Es gibt viele "nicht-parametrische" Clustering-Methoden wie hierarchisches Clustering, K-Means usw., aber das Problem ist immer, wie man beurteilt, ob Ihre Clustering-Lösung "besser" ist als andere mögliche Lösungen (und oft gibt es mehrere mögliche Lösungen). . Jeder Algorithmus gibt Ihnen das Beste, was er kann, aber woher wissen Sie, ob es nichts Besseres gibt? Nun gibt es auch parametrische Ansätze für das Clustering, das sogenannte modellbasierte Clustering, wie Finite Mixture Models. Mit FMM erstellen Sie ein statistisches Modell, das die Verteilung Ihrer Daten beschreibt und in Daten einfügt. Wenn Sie Ihr Modell haben, können Sie beurteilen, wie wahrscheinlich es ist, dass Ihre Daten für dieses Modell vorliegen, Sie können Likelihood Ratio-Tests verwenden, AICs vergleichen und verschiedene andere Methoden zum Überprüfen der Modellanpassung und des Modellvergleichs verwenden. Nichtparametrische Clustering-Algorithmen gruppieren Daten nur anhand einiger Ähnlichkeitskriterien. Mit FMM können Sie Ihre Daten beschreiben und zu verstehen versuchen, überprüfen, wie gut sie passen, Vorhersagen treffen ... In der Praxis sind nichtparametrische Ansätze einfach und funktionieren out-of-the-box und sind ziemlich gut, während FMM problematisch sein kann, aber dennoch liefern modellbasierte Ansätze häufig eine reichhaltigere Ausgabe.
quelle
Vorhersagen und Prognosen für neue Daten sind für nicht parametrische Modelle oft sehr schwierig oder unmöglich. Zum Beispiel kann ich die Anzahl der Garantieansprüche für die nächsten 10 Jahre mit einem Weibull- oder Lognormal-Überlebensmodell prognostizieren. Dies ist jedoch mit dem Cox-Modell oder Kaplan-Meier nicht möglich.
Edit: Lassen Sie mich etwas klarer sein. Wenn ein Unternehmen ein defektes Produkt hat, ist es häufig daran interessiert, die zukünftige Garantieanspruchsrate und den CDF auf der Grundlage der aktuellen Garantieansprüche und Verkaufsdaten zu prognostizieren. Dies kann ihnen bei der Entscheidung helfen, ob ein Rückruf erforderlich ist oder nicht. Ich weiß nicht, wie Sie dies mit einem nicht parametrischen Modell tun.
quelle
Ich glaube ehrlich, dass es keine richtige Antwort auf diese Frage gibt. Nach den gegebenen Antworten zu urteilen, ist der Konsens, dass parametrische Tests leistungsfähiger sind als nichtparametrische Äquivalente. Ich werde diese Ansicht nicht bestreiten, aber ich sehe sie eher als eine hypothetische als als eine sachliche Ansicht, da sie nicht ausdrücklich in den Schulen gelehrt wird und kein Gutachter Ihnen jemals sagen wird, "Ihre Arbeit wurde abgelehnt, weil Sie nicht-parametrische Tests verwendet haben". Diese Frage handelt von etwas, das die Welt der Statistik nicht eindeutig beantworten kann, aber für selbstverständlich gehalten hat.
Meine persönliche Meinung ist, dass die Bevorzugung von parametrisch oder nichtparametrisch mehr mit Tradition als mit irgendetwas anderem zu tun hat (aus Mangel an einem besseren Begriff). Parametrische Test- und Vorhersagetechniken waren zuerst vorhanden und haben eine lange Geschichte, daher ist es nicht einfach, sie vollständig zu ignorieren. Insbesondere die Vorhersage bietet einige beeindruckende nichtparametrische Lösungen, die heutzutage als Werkzeug der ersten Wahl weit verbreitet sind. Ich denke, dies ist einer der Gründe, warum maschinelles Lernen wie neuronale Netze und Entscheidungsbäume, die von Natur aus nichtparametrisch sind, in den letzten Jahren eine weit verbreitete Popularität erlangt haben.
quelle
Es ist eine Frage der statistischen Macht. Nichtparametrische Tests haben im Allgemeinen eine geringere statistische Aussagekraft als ihre parametrischen Gegenstücke.
quelle
Viele gute Antworten bereits, aber es gibt einige Gründe, die ich nicht erwähnt habe:
Vertrautheit. Abhängig von Ihrer Zielgruppe ist das parametrische Ergebnis möglicherweise viel vertrauter als ein ungefähr gleichwertiges nicht parametrisches. Wenn die beiden ähnliche Schlussfolgerungen ziehen, ist Vertrautheit gut.
Einfachheit. Manchmal ist der parametrische Test einfacher durchzuführen und zu protokollieren. Einige nichtparametrische Methoden sind sehr computerintensiv. Natürlich sind Computer viel schneller geworden und Algorithmen haben sich ebenfalls verbessert, aber ... Daten sind "größer" geworden.
quelle