Bei der linearen Regression gehen wir von folgenden Annahmen aus
Eine Möglichkeit, die lineare Regression zu lösen, sind normale Gleichungen, die wir als schreiben können
Aus mathematischer Sicht braucht die obige Gleichung nur umkehrbar zu sein. Warum brauchen wir diese Annahmen? Ich habe ein paar Kollegen gefragt und sie haben erwähnt, dass es gute Ergebnisse bringen soll, und normale Gleichungen sind ein Algorithmus, um dies zu erreichen. Aber wie helfen diese Annahmen in diesem Fall? Wie hilft es ihnen, ein besseres Modell zu erhalten?
regression
assumptions
Uhrensklave
quelle
quelle
Antworten:
Sie haben Recht - Sie müssen diese Annahmen nicht erfüllen, um eine Linie der kleinsten Quadrate an die Punkte anzupassen. Sie benötigen diese Annahmen, um die Ergebnisse zu interpretieren. Angenommen, es gibt keine Beziehung zwischen einer Eingabe und Y , wie hoch ist die Wahrscheinlichkeit, einen Koeffizienten zu erhaltenX1 Y wie groß β 1 erhalten wird, der mindestens so groß ist wie der, den wir aus der Regression gesehen haben?β1
quelle
quelle
Sie benötigen diese Annahmen nicht, um ein lineares Modell anzupassen. Ihre Parameterschätzungen können jedoch verzerrt sein oder nicht die Mindestvarianz aufweisen. Verstöße gegen die Annahmen erschweren Ihnen die Interpretation der Regressionsergebnisse, indem Sie beispielsweise ein Konfidenzintervall erstellen.
quelle
Ok, die Antworten gehen so weit: Wenn wir die Annahmen verletzen, können schlimme Dinge passieren. Ich glaube, die interessante Richtung ist: Wenn alle Annahmen erfüllt sind, die wir brauchen (die sich von den oben genannten ein wenig unterscheiden), warum und wie können wir sicher sein, dass die lineare Regression das beste Modell ist?
Ich denke, die Antwort auf diese Frage lautet: Wenn wir die Annahmen wie in der Antwort auf diese Frage treffen, können wir die bedingte Dichte berechnenp ( yich| xich) . Daraus können wir berechnenE[ Yich| Xich= xich] (die Faktorisierung der bedingten Erwartung bei xich ) und sehen, dass es sich in der Tat um die lineare Regressionsfunktion handelt. Dann verwenden wir dies, um zu sehen, dass dies die beste Funktion in Bezug auf das wahre Risiko ist.
quelle
Die beiden Hauptannahmen sind
Siehe Die Diskussion in Julian Faraways Buch .
Wenn beides zutrifft, ist OLS überraschend widerstandsfähig gegen Verstöße gegen die anderen von Ihnen aufgeführten Annahmen.
quelle