Steuerung für eine Variable in OLS - Stratifizierung und Reaggregation Einfaches Beispiel

1

In seinem spannenden Buch "Naked Statistics" beginnt Charles Wheelan zu erklären, wie das Steuern von Variablen funktioniert, indem das Sample stratifiziert wird. Er erklärt die Reaggregation jedoch nur kurz und erklärt, was die Stratifikationsanalogie fasziniert, aber er ist verwirrt, ob und wie er angewendet werden kann.

Um genauer zu sein, versucht er, die Auswirkung von Bildung auf das Gewicht zu isolieren, indem Geschlecht, Größe und Einkommen kontrolliert werden. Er stellt sich ein Experiment vor, bei dem sich mehrere Personen (die die Probe bilden) an einem Ort versammeln. Dann beginnt die Schichtung:

  1. Männer und Frauen sind getrennt
  2. Die Männer und Frauen werden getrennt nach Höhe unterteilt. An diesem Punkt, wie er es sagt, "wird es einen Raum von 6 Fuß großen Männern geben. Nebenan wird es einen Raum von 6 Fuß großen 1-Zoll-Männern geben"
  3. Schließlich kann jeder dieser Räume (identifiziert durch Kombinationen von Geschlecht und Größe) nach Einkommen unterteilt werden. Er sagt: "Irgendwann werden wir viele Räume haben, von denen jeder Einzelne enthält, die in jeder Hinsicht identisch sind, mit Ausnahme der Ausbildung und des Gewichts. Diese beiden Variablen interessieren uns. 5-Zoll-5-Zoll-Männer, die jährlich 30.000 bis 40.000 verdienen ".

Während wir uns in jedem dieser Räume stärker auf die Bildung konzentrieren können, ist es von Nutzen, dass wir mit einem Single Koeffizient, der die Beziehung zwischen Gewicht und Bildung in jedem dieser Räume einschließt?

Welche magische Analyse müsste unter Verwendung der Daten der Personen in jedem dieser Räume durchgeführt werden, die dann aggregiert werden könnten, um den Regressionskoeffizienten zu erhalten, der als Einfluss der unabhängigen interessierenden Variablen auf die abhängige Variable interpretiert werden kann, nachdem wir die Kontrolle übernommen haben für die zwei binären Variablen? Wie genau würde die Aggregation funktionieren?

Während ich diese Frage / Diskussion gefunden habe https://stats.stackexchange.com/questions/17336/wie- genau-tätig-eine-steuer-für-andere -Variablen Interessanterweise ist das Steuern einer Variablen durch ihre Einbeziehung in eine Regression aufschlussreich, aber keine sehr intuitive Antwort. Stratifizierung und Reaggregation versprechen, wenn möglich, ein intuitives Verständnis.

Illustratives Beispiel mit erfassten Zahlen : Auf der linken Seite sind die Ergebnisse der einfachen Regression des Bildungsgewichts (nach Stratifizierung nach Einkommen und Geschlecht) in jedem der 4 Räume (in jedem Raum mit 15 Personen / Beobachtungen) dargestellt, während auf der rechten Seite die Ergebnisse der mehrfachen Regression von Gewicht auf Bildung, Einkommen und Geschlecht (60 Personen / Beobachtungen zusammen).

Ist es möglich, die Ergebnisse der Regressionen, die in jedem der vier Räume erzielt wurden (nach Einkommen und Geschlecht stratifiziert), zu aggregieren, um den in der multiplen Regression (-3.28) ermittelten Bildungskoeffizienten zu erhalten, in dem wir das Einkommen und das Geschlecht kontrollieren?

enter image description here enter image description here

ColorStatistics
quelle
Es klingt wie eine Frage, wie Ihre Frage lautet: Wie funktioniert Regression? Nach dem Kontrollieren für jedes dieser Observablen bleibt die Variation zwischen Größe, Gewicht und was auch immer Sie nicht kontrollieren (z. B. Essgewohnheiten). Ihr Parameter repräsentiert Ihre Beispielschätzung des zugrunde liegenden Populationsparameters. Es klingt auch so, als ob Sie sich eher für Bayes'sche Schätzmethoden interessieren würden als für häufige Methoden. Ersteres ermöglicht Ihnen die Verwendung von Informationen zum Aktualisieren einer früheren Verteilung der Betaversion und der späteren Variationen der Stichprobenauswertung, um einen Populationsparameter zu schätzen.
123