Gilt das "No Free Lunch Theorem" für allgemeine statistische Tests?

Eine Frau, für die ich arbeitete, bat mich, eine Einweg-ANOVA für einige Daten durchzuführen. Ich antwortete, dass es sich bei den Daten um wiederholte Messdaten (Zeitreihen) handele und dass die Annahme der Unabhängigkeit verletzt sei. Sie antwortete, ich solle mich nicht um die Annahmen kümmern, sondern nur den Test machen und sie würde berücksichtigen, dass die Annahmen möglicherweise nicht erfüllt wurden.

Das schien mir nicht richtig zu sein. Ich habe einige Nachforschungen angestellt und fand diesen wundervollen Blog-Beitrag von David Robinson. K-means Clustering ist kein kostenloses Mittagessen , was mich mit dem No-Free-Lunch-Theorem konfrontiert. Ich habe mir das Originalpapier angesehen und einige folgen Sachen, und ehrlich gesagt ist die Mathematik ein bisschen über meinem Kopf.

Der Kern davon scheint laut David Robinson zu sein, dass die Macht eines statistischen Tests von seinen Annahmen herrührt. Und er gibt zwei großartige Beispiele. Während ich mich in den anderen Artikeln und Blog-Posts darüber umgesehen habe, scheint es, als würde immer entweder auf überwachtes Lernen oder auf Suche verwiesen.

Meine Frage ist also: Gilt dieser Satz für statistische Tests im Allgemeinen? Mit anderen Worten, kann man sagen, dass die Kraft eines t-Tests oder einer ANOVA von der Einhaltung der Annahmen herrührt, und das No-Free-Lunch-Theorem zitieren?

Ich schulde meinem ehemaligen Chef ein abschließendes Dokument über die von mir geleistete Arbeit, und ich würde gerne wissen, ob ich unter Bezugnahme auf das No-Free-Lunch-Theorem behaupten kann, dass Sie die Annahmen eines statistischen Tests nicht einfach ignorieren und sagen können, dass Sie dies berücksichtigen bei der Auswertung der Ergebnisse berücksichtigen.

assumptions rwjones
quelle

Warum machst du nicht einfach "heimlich" eine ANOVA mit wiederholten Messungen?

Horst Grünbusch

@ HorstGrünbusch Tatsächlich wurden die Daten und Tests bereits im Forum diskutiert, mit spezifischen Fragen zu ANOVA mit wiederholten Messungen, und es stellt sich heraus, dass ein lineares Modell mit gemischten Effekten wahrscheinlich die beste Wahl ist.

Rwjones

Dies ist bereits gut beantwortet, sodass eine flippigere Antwort hinzugefügt werden kann. Sie könnten Ihren Chef genau fragen, wie er die Konsequenzen einer Verletzung der Annahmen berücksichtigen würde ("vorsichtig sein" wäre besser als nichts!). Kurz gesagt, es ist ein langer und schwieriger Weg, genug Verständnis und Erfahrung zu sammeln, um zu wissen, wann Sie bei Annahmen nachlässig sein können. Rupert G. Millers Beyond ANOVA (New York: Wiley, 1986 und spätere Nachdrucke) ist eine gute Quelle für die Folgen, und ein Hauptthema darin ist, dass das Ignorieren von Unabhängigkeitsannahmen eines der gefährlichsten Dinge ist, die Sie tun können.

Nick Cox

@ NickCox Nun, sie ist nicht länger meine Chefin, und diese besondere Situation ist der Hauptgrund dafür. Es war im Grunde der Höhepunkt einer Menge schlampigen Denkens und schlampigen Projektmanagements von ihr in einem ansonsten anständigen Forschungsumfeld. Abgesehen davon, danke für die Buchempfehlung. Vom Klang her ist es eines der Dinge, die ich in meinem Abschlussbericht zitieren möchte.

rwjones

Antworten:

Ich kenne keinen Beweis, aber ich wette, das gilt ganz allgemein. Ein Beispiel ist ein Experiment mit 2 Probanden in jeder von 2 Behandlungsgruppen. Der Wilcoxon-Test kann bei 0,05 möglicherweise nicht signifikant sein, der t-Test jedoch. Man könnte sagen, dass seine Macht mehr als die Hälfte aus seinen Annahmen und nicht nur aus den Daten stammt. Für Ihr ursprüngliches Problem ist es nicht angebracht, so zu verfahren, als ob die Beobachtungen pro Proband unabhängig wären. Nachträgliche Berücksichtigung ist sicherlich keine gute statistische Praxis, außer unter ganz besonderen Umständen (z. B. Cluster-Sandwich-Schätzer).

Frank Harrell
quelle

Wenn Sie möchten, können Sie das No-Free-Lunch-Theorem zitieren , aber Sie können auch nur den Modus Ponens (auch als Gesetz der Loslösung bekannt , die Grundlage des deduktiven Denkens) zitieren , der die Wurzel des No-Free-Lunch-Theorems ist .

Das No-Free-Lunch-Theorem umfasst eine spezifischere Idee: die Tatsache, dass es keinen Algorithmus gibt, der für alle Zwecke geeignet ist. Mit anderen Worten, das No-Free-Lunch-Theorem besagt im Grunde, dass es keine algorithmische Wunderwaffe gibt . Dies beruht auf dem Modus Ponens, denn damit ein Algorithmus oder ein statistischer Test das richtige Ergebnis liefert, müssen Sie die Voraussetzungen erfüllen.

Wenn Sie, wie in allen mathematischen Theoremen, die Prämissen verletzen, ist der statistische Test nur sinnlos und Sie können daraus keine Wahrheit ableiten. Wenn Sie Ihre Daten anhand Ihres Tests erläutern möchten, müssen Sie davon ausgehen, dass die erforderlichen Voraussetzungen erfüllt sind. Wenn dies nicht der Fall ist (und Sie das wissen), ist Ihr Test absolut falsch.

Das liegt daran, dass wissenschaftliches Denken auf Deduktion beruht: Grundsätzlich ist Ihr Test / Gesetz / Satz eine Implikationsregel , die besagt, dass Sie, wenn Sie die Prämisse haben , Afolgern können B: A=>BWenn Sie aber keine haben A, können Sie entweder haben Boder nicht B, und beide Fälle sind wahr , das ist eine der Grundannahmen für logische Folgerungen / Folgerungen (die Modus-Ponens-Regel). Mit anderen Worten, wenn Sie gegen die Prämissen verstoßen, spielt das Ergebnis keine Rolle und Sie können keine Schlussfolgerungen ziehen .

Denken Sie an die binäre Implikationstabelle:

A   B   A=>B
F   F    T
F   T    T
T   F    F
T   T    T

In Ihrem Fall haben Sie also, um es zu vereinfachen Dependent_Variables => ANOVA_correct. Wenn Sie also unabhängige Variablen verwenden, Dependent_Variablesist Falsedie Implikation wahr, da die Dependent_VariablesAnnahme verletzt wird.

Dies ist natürlich sehr simpel und in der Praxis liefert Ihr ANOVA-Test möglicherweise immer noch nützliche Ergebnisse, da fast immer ein gewisser Grad an Unabhängigkeit zwischen abhängigen Variablen besteht. Dies gibt Ihnen jedoch die Idee, warum Sie sich nicht einfach auf den Test verlassen können, ohne die Annahmen zu erfüllen .

Sie können jedoch auch Tests verwenden, bei denen das Original die Voraussetzungen nicht erfüllt, indem Sie Ihr Problem reduzieren : Wenn Sie die Abhängigkeitsbeschränkung explizit lockern, ist Ihr Ergebnis möglicherweise immer noch aussagekräftig, auch wenn dies nicht garantiert ist (da Ihre Ergebnisse dann für das reduzierte Problem gelten, nicht für das Sie können also nicht alle Ergebnisse übersetzen, es sei denn, Sie können nachweisen, dass die zusätzlichen Einschränkungen des neuen Problems sich nicht auf Ihren Test und damit auf Ihre Ergebnisse auswirken.

In der Praxis wird dies häufig verwendet, um praktische Daten zu modellieren, beispielsweise mithilfe von Naive Bayes, indem abhängige (statt unabhängiger) Variablen mithilfe eines Modells modelliert werden, das unabhängige Variablen voraussetzt, und überraschenderweise funktioniert es oft sehr gut und manchmal besser als die Modellrechnung für Abhängigkeiten . Diese Frage zur Verwendung von ANOVA kann Sie auch interessieren, wenn die Daten nicht genau den Erwartungen entsprechen .

Zusammenfassend: Wenn Sie beabsichtigen, an praktischen Daten zu arbeiten, und Ihr Ziel darin besteht, kein wissenschaftliches Ergebnis zu beweisen, sondern ein System zu erstellen, das nur funktioniert (dh einen Webdienst oder eine beliebige praktische Anwendung), die Annahme der Unabhängigkeit (und möglicherweise andere Annahmen) kann gelockert werden, aber wenn Sie versuchen , eine allgemeine Wahrheit abzuleiten / zu beweisen , sollten Sie immer Tests verwenden, die Sie mathematisch garantieren können (oder zumindest sicher und nachweislich davon ausgehen können), dass Sie alle Voraussetzungen erfüllen .

mühsam
quelle

Wenn ich Ihre Argumentation richtig verstehe, beginnen Sie damit, dass keine Anwendung von Statistiken gültig ist, für die Annahmen nicht genau erfüllt sind. Wenn das stimmt, sind das in der Tat sehr schlechte Nachrichten. Die meisten ökonometrischen Bücher (um nur ein Beispiel zu nennen) verbringen ihre Zeit damit, zu erklären, dass es falsch ist (ein Wort Zusammenfassung) und genau warum. Sie scheinen jedoch Ihre Richtung in der Mitte zu ändern, und was Sie stattdessen befürworten, ist dann unscharf. Irgendwie kann das Arbeiten an den Daten auch dann einwandfrei sein, wenn sie logisch ungültig sind. Daher sehe ich hier keine klaren Ratschläge.

Nick Cox

Der Punkt ist: Wenn die Prämissen verletzt werden, können Sie die Testergebnisse nicht zum Nennwert bewerten, da die Inferenz verzerrt ist. Sie können es trotzdem versuchen, und wenn Sie sicher und erfahren genug sind, können Sie immer noch etwas daraus machen, aber meistens bei praktischen Implementierungen, bei denen Sie sich nicht für wissenschaftliches Denken interessieren (Sie versuchen nur zu modellieren) die Daten für ein praktisches Ziel, ohne auf eine fundierte allgemeine Wahrheit über die Welt schließen zu wollen). Meine Antwort ist also keine "Ein-Wort-Zusammenfassung", sondern nur der allgemeine Fall (falsch) vs. der spezifische Fall (kann in Ordnung sein).

Gaborous

PS: Meine Aussage betrifft nicht nur statistische Anwendungen, sondern jede Anwendung eines logischen oder mathematischen Theorems / einer Regel / eines Tests. Dies gilt auch für Argumente, die auf Inferenz und Induktion beruhen. Aber ich interessiere mich für Ihre Referenzen zu Ökonometrie-Büchern. Die andere Referenz, die Sie in einem Kommentar zur Frage des OP angegeben haben, war sehr relevant.

Gaborous

Danke, dass Sie einen Kommentar hinzugefügt haben, aber ich muss sagen, dass ich Ihre Aussage nicht besonders klar oder begründet finde. Ich kann nicht sehen, dass arbeitende Wissenschaftler (ich bin einer) Ihre Unterscheidung zwischen Datenanalyse für wissenschaftliches Denken und für praktische Ziele verstehen werden. Ich werde es dort belassen, außer um Lehrbücher wie die von Jeff Wooldridge zu empfehlen, da es in der Tat um erweiterte Aufsätze geht, bei denen Annahmen entscheidend sind, nicht aber um eine große Grauzone dazwischen. amazon.com/Jeffrey-M.-Wooldridge/e/B001IGLWNY

Nick Cox

Vielen Dank für den Hinweis. Ich habe gerade eine andere Frage gefunden, in der sie ein Papier erwähnen, das erklärt, warum naive Unabhängigkeitsannahmen immer noch mit Daten mit abhängigen Variablen funktionieren können: "Das Papier scheint zu beweisen, dass (naive) Bayes nicht nur gut sind, wenn Features unabhängig sind, sondern auch, wenn Abhängigkeiten zwischen den Features sind ähnlich / gegensätzlich " stats.stackexchange.com/a/23491/25538

gaborous