Ich lese gerade das Kapitel über den Kompromiss zwischen Bias-Varianz und den Elementen des statistischen Lernens und bezweifle, dass die Formel auf Seite 29 basiert. Die Daten ergeben sich aus einem Modell, bei dem wobei zufällig ist Zahl mit dem erwarteten Wert und Varianz . Der erwartete Fehlerwert des Modells sei wobei die Vorhersage von unseres Lerners ist. Nach dem Buch ist der Fehler
Meine Frage ist, warum Bias-Term nicht 0 ist? bei der Entwicklung der Fehlerformel sehe ich
as ist eine unabhängige Zufallszahl2 E [ ( f ( x ) - f k ( x ) ) ε ] = 2 E [ ( f ( x ) - f k ( x ) ) ] E [ ε ] = 0
Wo irre ich mich
Einige weitere Schritte der Bias - Varianz - Zerlegung
In der Tat wird die vollständige Herleitung in Lehrbüchern selten angegeben, da es sich um eine Menge langweiliger Algebra handelt. Hier ist eine vollständigere Ableitung unter Verwendung der Notation aus dem Buch "Elemente des statistischen Lernens" auf Seite 223
Wenn wir annehmen , daß und und dann können wir den Ausdruck für die zu erwartenden Prädiktionsfehler einer Regressionsanpassung abzuleiten an einem Eingang Verwendung eines quadratischen FehlerverlustsY.= f( X) + ϵ E[ ϵ ] = 0 Va r ( ϵ ) = σ2ϵ f ( X ) X = x 0f^( X) X= x0
Zur Vereinfachung der Schreibweise sei , und es sei daran erinnert, dass undf^( x0) = f^ f( x0) = f E[f] = f E[ Y] = f
Für den Term wir einen ähnlichen Trick wie oben anwenden, indem wir addieren und subtrahieren , um zu erhaltenE[ ( f- f^)2] E[ f^]
Etwas zusammensetzen
Einige Kommentare, warumE[ f^Y.] = fE[ f^]
Entnommen hier Alecos Papadopoulos
Denken Sie daran, dass der Prädiktor ist, den wir basierend auf den Datenpunkten konstruiert haben. damit wir schreiben können, um uns daran zu erinnern.f^ m { ( x( 1 ), y( 1 )) , . . . , ( x( m ), y( m )) } f^= f^m
Andererseits ist die Vorhersage, die wir auf einem neuen Datenpunkt unter Verwendung des Modells machen, das auf den obigen Datenpunkten konstruiert ist . So kann der mittlere Fehlerquadrat als geschrieben werdenY. ( x( m + 1 ), y( m + 1 )) m
Erweiterung der Gleichung aus dem vorherigen Abschnitt
Der letzte Teil der Gleichung kann als angesehen werden
Da wir für den Punkt folgende Annahmen treffen :x( m + 1 )
Andere Quellen mit vollständigen Ableitungen
quelle