Ich suche eine erweiterte Fallstudie zur linearen Regression, die die erforderlichen Schritte zur Modellierung komplexer, mehrfacher nichtlinearer Beziehungen mithilfe von GLM oder OLS veranschaulicht. Es ist überraschend schwierig, Ressourcen zu finden, die über grundlegende Schulbeispiele hinausgehen: Die meisten Bücher, die ich gelesen habe, gehen nicht weiter als eine logarithmische Transformation der Antwort in Verbindung mit einer BoxCox mit einem Prädiktor oder einem natürlichen Spline im besten Fall. Außerdem haben alle Beispiele, die ich bisher gesehen habe, jedes Datentransformationsproblem in einem separaten Modell behandelt, häufig in einem einzelnen Prädiktormodell.
Ich weiß, was eine BoxCox- oder YeoJohnson-Transformation ist. Was ich suche, ist eine detaillierte, reale Fallstudie, bei der die Reaktion / Beziehung nicht eindeutig ist. Die Antwort ist beispielsweise nicht unbedingt positiv (Sie können also weder log noch BoxCox verwenden), die Prädiktoren haben nichtlineare Beziehungen untereinander und zur Antwort, und die maximale Wahrscheinlichkeit von Datentransformationen scheint keinen Standard von 0,33 zu implizieren oder 0,5 Exponent. Auch die Restvarianz ist nicht konstant (niemals), so dass auch die Antwort transformiert werden muss und Entscheidungen zwischen einer nicht standardmäßigen GLM-Familienregression oder einer Antworttransformation getroffen werden müssen. Der Forscher wird wahrscheinlich Entscheidungen treffen, um eine Überanpassung der Daten zu vermeiden.
BEARBEITEN
Bisher habe ich folgende Ressourcen gesammelt:
- Regressionsmodellierungsstrategien, F. Harrell
- Angewandte ökonometrische Zeitreihen, W. Enders
- Dynamische lineare Modelle mit R, G. Petris
- Angewandte Regressionsanalyse, D. Kleinbaum
- Eine Einführung in das statistische Lernen, G. James / D. Witten
Ich habe nur das letzte (ISLR) gelesen und es ist ein sehr guter Text (5 fünf Sterne auf meiner Uhr), obwohl er sich mehr an ML als an fortgeschrittener Regressionsmodellierung orientiert.
Es gibt auch diesen guten Beitrag im Lebenslauf, der einen herausfordernden Regressionsfall darstellt.
quelle
Antworten:
Regressionsmodellierungsstrategien und ISLR, die bereits von anderen erwähnt wurden, sind zwei sehr gute Vorschläge. Ich habe ein paar andere, die Sie in Betracht ziehen könnten.
Applied Predictive Modeling von Kuhn und Johnson enthält eine Reihe guter Fallstudien und ist sehr praktisch.
Verallgemeinerte additive Modelle: Eine Einführung mit R von Simon Wood ist eine gute Behandlung von verallgemeinerten additiven Modellen und wie Sie sie unter Verwendung seines
mgcv
Pakets für R anpassen. Es enthält einige nicht triviale praktische Beispiele. Die Verwendung von GAM-Modellen ist eine Alternative zur Ermittlung der "richtigen" Transformation, da dies auf datenadaptive Weise über eine Spline-Erweiterung und eine bestrafte Maximum-Likelihood-Schätzung erfolgt. Es müssen jedoch noch andere Entscheidungen getroffen werden, z. B. die Auswahl der Verbindungsfunktion.Der Boost Paket für R passt auch für GAM-Modelle, verwendet jedoch einen anderen Ansatz durch Boosten. Ich empfehle das Tutorial für das Paket (eine der Vignetten).
Ich werde auch die empirische Modellentdeckung und Theorieevaluierung von Hendry und Doornik erwähnen , obwohl ich dieses Buch selbst noch nicht gelesen habe. Es war mir empfohlen worden.
quelle
Eines der besten Kursmaterialien , das Sie zu fortgeschrittener, multipler, komplexer (einschließlich nichtlinearer) Regression finden können, basiert auf dem Buch Regression Modeling Strategies von Frank E. Harrell Jr.
Das Buch wird in den Kommentaren diskutiert, aber nicht dieses Material, das selbst eine großartige Ressource darstellt.
quelle
Ich würde das Buch Mostly Harmless Econometrics empfehlen von Joshua D. Angrist und Jörn-Steffen Pischke
Dies ist der realistischste Text, den ich besitze, und er ist super günstig und kostet etwa 26,00 USD. Das Buch ist für den studierten Statistiker / Ökonomen geschrieben, es ist also weit fortgeschritten.
Nun, dieses Buch ist nicht genau das, wonach Sie fragen, in dem Sinne, dass es sich nicht so sehr auf "komplexe, mehrfache nichtlineare Beziehungen" konzentriert wie auf Kerngrundlagen wie Endogenität, Interpretation und cleveres Regressionsdesign.
Aber ich biete dieses Buch an, um zu versuchen, einen Punkt zu machen. Das heißt, wenn es um die praktische Anwendung der Regressionsanalyse geht, haben die schwierigsten Probleme im Allgemeinen nicht damit zu tun, dass unsere Modelle nicht komplex genug sind Modelle! Vielmehr sind die größten Probleme Dinge wie
Ein sicheres Verständnis von GMM, nichtlinearen Filtern und nichtparametrischer Regression deckt praktisch alle von Ihnen aufgeführten Themen ab und kann im Laufe der Zeit erlernt werden. Bei realen Daten können diese Frameworks jedoch unnötig komplex sein, was häufig schädlich ist.
Allzu oft ist es die Fähigkeit, klug zu sein, anstatt vollständig verallgemeinert und hochentwickelt zu sein, die Ihnen bei der Analyse in der realen Welt am meisten zugute kommt. Dieses Buch hilft Ihnen bei Ersterem.
quelle
Unter Einführung in das statistische Lernen mit R (ISLR) wird ausführlich auf Splines und die polynomiale Regression eingegangen.
quelle
Ich bin mir nicht sicher, was das Ziel Ihrer Frage ist. Ich kann Greene's Text zur ökonometrischen Analyse empfehlen . Es hat eine Menge Verweise auf Papiere im Inneren. So ziemlich jedes Beispiel in dem Buch verweist auf ein veröffentlichtes Papier.
Schauen Sie sich Beispiel 7.6 "Interaktionseffekte in einem loglinearen Einkommensmodell" auf S.195 an, um einen Eindruck zu bekommen. Es bezieht sich auf eine Arbeit und den Datensatz: Regina T. Riphahn, Achim Wambach und Andreas Million, " Anreizeffekte bei der Nachfrage nach Gesundheitsversorgung: Eine Schätzung der bivariaten Panelanzahl ", Journal of Applied Econometrics, Vol. 18, Nr. 4, 2003, S. 387-405.
Das Beispiel handelt von der Verwendung der loglinearen Modelle und den Interaktionseffekten. Sie können das gesamte Papier oder die Beschreibung dieses Lehrbuchs lesen. Dies ist kein erfundener Anwendungsfall. Es ist eine echte veröffentlichte Forschung. So wenden die Menschen die statistischen Methoden in der Wirtschaftsforschung tatsächlich an.
Wie ich schrieb, ist das Buch mit Anwendungsfällen wie diesen über die Verwendung fortgeschrittener statistischer Methoden belastet.
quelle
Haben Sie sich einige der Kurse / Bücher zur Analyse von Finanzzeitreihen angesehen, die Ruey Tsay (UChicago) schreibt?
http://faculty.chicagobooth.edu/ruey.tsay/teaching/
Die Kurse von Ruey Tsays und das Lehrbuch bieten zahlreiche Beispiele aus der Praxis für die Finanzierung komplexer Regressionen, die für den Einsatz an Finanzmärkten erstellt wurden. Kapitel 1 beginnt mit Multifaktor-Regressionsmodellen und wird um Kapitel 5 oder 6 zu saisonalen autoregressiven Zeitreihenmodellen erweitert.
quelle