Wenn ich jede Probenbeobachtung in einem linearen Regressionsmodell wiederhole und die Regression erneut durchführe, wie würde sich dies auf das Ergebnis auswirken?
15
Angenommen, ich habe N Beobachtungen, möglicherweise mehrere Faktoren, und ich wiederhole jede Beobachtung zweimal (oder M Mal).
Wie Sie sehen, werden früher nicht signifikante Koeffizienten (Längen) im erweiterten Modell statistisch signifikant und repräsentieren die Präzision, mit der Sie wissen, was Sie wissen.
Ja Standardfehler gehen in der Tat runter. Einige empfehlen hierfür eine gewichtete lineare Regression. Gibt es eine Methode, mit der Sie dies beheben können?
BBDynSys
3
Eine gewöhnliche lineare Regression löst das Problem
w∗= Argminw| | Xw - y| |2
wo X ist die Matrix der Prädiktoren und yist die Antwort. Wenn Sie jede Probe wiederholenM Mal würde die Zielfunktion unverändert minimiert werden (mit Ausnahme eines multiplikativen Faktors) M). Daher wäre der Gewichtsvektor, der für das größere Problem optimal ist, der gleiche wie für das ursprüngliche kleinere Problem.
Einverstanden, aber ich denke, dass sich die Statistiken und Standardfehler ändern sollten, wenn von N zu NM gewechselt wird?
Palace Chan
Da OLS davon ausgeht, dass das Rauschen unabhängig ist, wäre der Standardfehler unterschiedlich, da die Anzahl der Freiheitsgrade wäre M∗ N- P (N ist Originalgröße und P ist die Anzahl der Prädiktoren) und die Länge des Restvektors steigt um einen Faktor von M.
Eine gewöhnliche lineare Regression löst das Problem
quelle