Ich habe an meinem College einen Maschinellen Lernkurs absolviert. In einem der Quiz wurde diese Frage gestellt.
Modell 1: Modell 2:
Welches der oben genannten Modelle passt besser zu Daten? (Angenommen, Daten können mit linearer Regression modelliert werden.)
Die richtige Antwort (laut Professor) ist, dass beide Modelle gleich gut abschneiden würden. Ich glaube jedoch, dass das erste Modell besser passen würde.
Dies ist der Grund für meine Antwort. Das zweite Modell, das umgeschrieben werden kann als , wäre nicht dasselbe wie das erste Modell. ist in der Tat eine Parabel und hat daher einen Mindestwert ( in diesem Fall ). Aus diesem Grund ist der Bereich von im ersten Modell größer als der Bereich von im zweiten Modell. Wenn die Daten so waren, dass die beste Anpassung eine Steigung von weniger als , würde das zweite Modell im Vergleich zum ersten Modell sehr schlecht . Falls jedoch die Steigung der besten Anpassung größer als , würden beide Modelle gleich gut .α - 0,25 - 0,25 α - 0,25 θ
Ist also der erste besser oder sind beide genau gleich?
Antworten:
Modell 2 kann geschrieben werden als: Dies scheint ähnlich zu Modell 1 zu sein, nur mit unterschiedlicher Notation für die Hyperparameter ( θ , β ). Doch für Modell 1 können wir schreiben θ = ( X
Da aber in Modell 2 wir diese haben dann , wie Sie erwähnt in der Tat der Bereich von β gehören soll [ - 0,25 , + ∞ ] für θ & egr ; R . Was zu Unterschieden bei diesen beiden Modellen führen wird.
So ist in Modell 2 Sie Koeffizientenschätzung im Gegensatz zu Modell sind beschränke 1. Um dies deutlicher, sei darauf hingewiesen, dass in Modell durch die Minimierung der quadratischen Verlustfunktion erhalten wird θ = arg min θ & egr ; R ( y - X θ )θ^
Jedoch in dem Modell 2 der Schätzwert erhaltendurch
β =arg min β ≥ - 0,25 (y-Xβ)
quelle
Ich bin mir nicht sicher, ob ich deine Argumentation verstehe. Wenn du nimmst:
quelle