In der statistischen Modellierung: Die zwei Kulturen schreibt Leo Breiman
Die derzeitige angewandte Praxis besteht darin, die Anpassung des Datenmodells mithilfe von Anpassungstests und Restanalyse zu überprüfen. Vor einigen Jahren habe ich einmal ein simuliertes Regressionsproblem in sieben Dimensionen mit einem kontrollierten Maß an Nichtlinearität erstellt. Standardtests der Anpassungsgüte lehnten die Linearität erst ab, wenn die Nichtlinearität extrem war.
Breiman gibt keine Details seiner Simulation an. Er bezieht sich auf einen Artikel, der seiner Ansicht nach theoretisch gerechtfertigt ist, aber der Artikel ist unveröffentlicht.
Hat jemand ein veröffentlichtes Simulationsergebnis oder eine theoretische Abhandlung gesehen, die Briemans Behauptung stützt?
quelle
Antworten:
Ich erstellte eine Simulation, die Breimans Beschreibung entsprach, und fand nur das Offensichtliche: Das Ergebnis hängt vom Kontext ab und davon, was mit "extrem" gemeint ist.
Man könnte eine Menge sagen, aber lassen Sie mich dies auf ein Beispiel beschränken, das mit Hilfe eines leicht zu modifizierenden
R
Codes erstellt wurde, den interessierte Leser für ihre eigenen Untersuchungen verwenden können. Dieser Code beginnt mit der Erstellung einer Entwurfsmatrix, die aus ungefähr gleichmäßig verteilten unabhängigen Werten besteht, die ungefähr orthogonal sind (damit wir nicht auf Multikollinearitätsprobleme eingehen). Es berechnet eine einzige quadratische (dh nichtlineare) Wechselwirkung zwischen den ersten beiden Variablen: Dies ist nur eine von vielen Arten von "Nichtlinearitäten", die untersucht werden könnten, aber zumindest eine allgemein bekannte. Dann standardisiert es alles so, dass die Koeffizienten vergleichbar sind:Für das Basis-OLS-Modell (ohne Nichtlinearität) müssen einige Koeffizienten und die Standardabweichung des Restfehlers angegeben werden. Hier ist eine Reihe von Einheitskoeffizienten und eine vergleichbare SD:
Anstatt die gesamte Ausgabe hier durchzugehen, schauen wir uns diese Daten mit der Ausgabe des
plot
Befehls an:Die geringen Spuren im unteren Dreieck zeigen im Wesentlichen keine lineare Beziehung zwischen der Wechselwirkung (
x.12
) und der abhängigen Variablen (y
) und bescheidene lineare Beziehungen zwischen den anderen Variablen undy
. Die OLS-Ergebnisse bestätigen dies; Die Wechselwirkung ist kaum signifikant:Ich nehme den p-Wert des Interaktionsterms als Test für die Nichtlinearität: Wenn dieser p-Wert ausreichend niedrig ist (Sie können wählen, wie niedrig er sein soll), haben wir die Nichtlinearität erkannt.
(Hier gibt es eine subtile Frage, wonach genau wir suchen. In der Praxis müssen wir möglicherweise alle 7 * 6/2 = 21 möglichen quadratischen Wechselwirkungen sowie vielleicht 7 weitere quadratische Terme untersuchen, anstatt uns auf einen einzelnen Term zu konzentrieren Wie hier beschrieben, möchten wir eine Korrektur für diese 28 miteinander in Zusammenhang stehenden Tests vornehmen. Diese Korrektur nehme ich hier nicht explizit vor, da stattdessen die simulierte Verteilung der p-Werte angezeigt wird. Sie können die Erkennungsraten direkt ablesen die Histogramme am Ende basieren auf Ihren Signifikanzschwellen.)
Aber lassen Sie uns diese Analyse nicht nur einmal durchführen. Lass es uns viele Male tun, indem wir
y
in jeder Iteration neue Werte nach demselben Modell und derselben Entwurfsmatrix generieren . Um dies zu erreichen, verwenden wir eine Funktion, um eine Iteration durchzuführen und den p-Wert des Interaktionsterms zurückzugeben:Ich beschließe, die Simulationsergebnisse als Histogramme der p-Werte darzustellen, wobei der standardisierte Koeffizient
gamma
des Interaktionsterms variiert wird . Zunächst die Histogramme:Nun, um die Arbeit zu erledigen. Für 1000 Versuche pro Simulation (und vier unabhängige Simulationen, die mit dem angegebenen Wert des Interaktionsbegriffs beginnen und ihn jedes Mal nacheinander halbieren) sind einige Sekunden erforderlich:
Die Ergebnisse:
x
sd
beta
gamma
x
sd
beta
sd
Kurz gesagt, eine Simulation wie diese kann beweisen, was Sie wollen, wenn Sie sie nur einrichten und richtig interpretieren. Das bedeutet, dass der einzelne Statistiker seine eigenen Untersuchungen durchführen sollte, die auf die jeweiligen Probleme zugeschnitten sind, um ein persönliches und tiefes Verständnis für die Fähigkeiten und Schwächen der von ihm verwendeten Verfahren zu erlangen.
quelle
R
und schätze solche Hinweise immer.Nicht sicher , es gibt eine endgültige Antwort auf die Frage, aber ich würde einen Blick auf gibt diese . Insbesondere Punkt 2. Siehe auch die Diskussion in Anhang A2 des Papiers .
quelle