Ist es möglich, eine Regression durchzuführen, bei der Sie eine unbekannte / nicht erkennbare Feature-Variable haben?
Sag ich habe aber ich kann / kann den Wert der Merkmalsvariablen nicht messen . Kann ich trotzdem eine Regression durchführen, um die Koeffizienten zu ermitteln??
Wie wäre es, wenn ich etwas über die Statistik weiß, wie wird ausgeliefert? Wenn ich das weiß wird aus einer Gaußschen Verteilung gezogen mit bekannt erlaubt mir dies, die Regression durchzuführen, um die Werte von zu ermitteln ?
regression
machine-learning
stochastic-processes
SomeRandomPhysicist
quelle
quelle
Antworten:
Die vollständige Formel für ein lineares Modell lautet (in Quasi-Matrixform).
Wir haben also mehrere Koeffizienten für die Variablen, für die wir steuern, und dann haben wirϵ Das ist alles andere, was wir mit unseren enthaltenen Variablen nicht erklärt haben.
In diesen Fehlerbegriff gehören alle Variablen, die wir nicht berücksichtigt haben, entweder weil wir keine Informationen für sie haben oder weil wir sie einfach nicht kennen (zufällige Abweichung).
Sie können also einfach nicht wissen, was in diesem Begriff zu welchem unbekannten Begriff gehört.
quelle
Wenn Sie die Regression von tuny auf x1 und x2 , wenn Sie bereit sind, fundierte Vermutungen anzustellen, wie x3 Korreliert mit jedem dieser Faktoren, können Sie berechnen, was diese Vermutungen für die Änderung der von Ihnen geschätzten Koeffizienten bedeuten würden, wenn Sie dies beobachten könnten x3 und lief die volle Regression.
Nehmen wir zum Beispiel das anx3 ist nicht korreliert mit x1 . Dann
Also wennx3 ist wahrscheinlich nur schwach korreliert mit y oder x1 und x2 es würde sich nicht viel ändern. Wenn dies der Fall ist, können Sie diese Formeln für ausgelassene variable Verzerrungen verwenden, um vorherzusagen, wie sich die Dinge ändern würden.
quelle
Es ist immer möglich ... aber Ihre Schätzungen werden in vielen Fällen voreingenommen sein. Der günstigste Fall tritt auf:x3n ist nicht mit den anderen Regressoren korreliert, in diesem Fall Regress yn auf (ι,x1,x2) und Sie haben unvoreingenommene Schätzungen von a0,a1,a2 (Frish-Waugh-Lovell-Theorem) σ und x3∼N(0,σ2) , dann können Sie sogar identifizieren a3 : zeichnen N iid Werte für x3n∼N(0,σ2) und Rückschritt yn auf (ι,x1,x2,x3) .
(a) Wann
(b) Wenn Sie zusätzlich zu (a) wissen
quelle