Viele Lehrbücher und Papiere sagten, dass das Abfangen nicht unterdrückt werden sollte. Kürzlich habe ich einen Trainingsdatensatz verwendet, um ein lineares Regressionsmodell mit oder ohne Achsenabschnitt zu erstellen. Ich war überrascht festzustellen, dass das Modell ohne Achsenabschnitt in einem unabhängigen Validierungsdatensatz eine bessere Vorhersage als das mit einem Achsenabschnitt in Bezug auf rmse liefert. Ist die Vorhersagegenauigkeit einer der Gründe, warum ich Zero-Intercept-Modelle verwenden sollte?
8
Antworten:
Schauen Sie sich genau an, wie die rmse oder eine andere Statistik berechnet wird, wenn Sie No-Intercept-Modelle mit Intercept-Modellen vergleichen. Manchmal unterscheiden sich die Annahmen und Berechnungen zwischen den beiden Modellen, und eines passt möglicherweise schlechter, sieht aber besser aus, weil es durch etwas viel Größeres geteilt wird.
Ohne ein reproduzierbares Beispiel ist es schwierig zu sagen, was dazu beitragen kann.
quelle
Ich denke nicht, dass Sie Modelle auswählen sollten, nur weil sie in einer bestimmten Stichprobe besser funktionieren, obwohl es gut ist, dass Sie eine Schulungs- und Validierungsstichprobe verwendet haben.
Schauen Sie sich vielmehr an, was die Modelle über Ihre Situation sagen. In einigen Fällen ist ein Null-Intercept-Modell sinnvoll. Wenn der DV 0 sein soll, wenn alle IVs 0 sind, verwenden Sie ein Null-Intercept-Modell. Sonst nicht.
Inhaltliches Wissen sollte die Statistik leiten, nicht umgekehrt
quelle
Ein No-Intercept-Modell kann sinnvoll sein, wenn zwei Bedingungen erfüllt sind. Erstens sollte es eine vernünftige Erwartung des Fachwissens geben, dass der Achsenabschnitt Null ist. Zweitens sollte es eine vernünftige Erwartung des Fachwissens geben, dass die Regressionslinie eine gerade Linie bleibt, wenn Sie sich Null nähern. Selbst wenn beide Bedingungen erfüllt sind, ist es ratsam, eine Analyse mit einem Intercept-Term durchzuführen und sicherzustellen, dass sich der Intercept nicht wesentlich von Null unterscheidet.
(Ich gehe davon aus, dass Sie von einem kontinuierlichen Y und einem kontinuierlichen X sprechen.)
quelle
Dies wäre verständlich, wenn der von Ihnen erhaltene Abschnitt lediglich Rauschen wäre - kein Sig. anders als Null. (Habe ich Recht, dass die standardisierten Regressionskoeffizienten in beiden Modellen nahezu gleich waren?) Wenn ja, sollten Sie dieses Beispiel nicht verallgemeinern. Wenn Abschnitte sig sind. und wesentlich, sie fügen etwas Sinnvolles zur Vorhersagegenauigkeit hinzu.
quelle
In der linearen Regression passen Sie:
Randnotiz: Die logistische Regression von scikit reguliert standardmäßig den Achsenabschnitt. Weiß jemand warum: http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html ? Ich denke nicht, dass es eine gute Idee ist .
quelle