Ich habe das Originalpapier über Dropout ( https://www.cs.toronto.edu/~hinton/absps/JMLRdropout.pdf ) gelesen und im Abschnitt über lineare Regression heißt es:
reduziert zu:
Ich habe Probleme zu verstehen, wie sie zu diesem Ergebnis gekommen sind. Kann jemand helfen?
regression
dropout
Doug
quelle
quelle
Antworten:
Wenn wir dies , können wir feststellen, dass und wir haben In ich gezeigt, dass jedes nicht diagonale Element Null ist, so dass das Ergebnis Das Papier definiert also was bedeutet, dass wir sind fertig.∥ y- p X.w∥2=yT.y- 2 pwT.X.T.y+p2wT.X.T.X.w E.R.∥ y- M.w∥2=yT.y- 2 pwT.X.T.y+wT.E.R.(M.T.M.) w= ∥ y- p X.w∥2- -p2wT.X.T.X.w +wT.E.R.(M.T.M.) w= ∥ y- p X.w∥2+wT.(E.R.(M.T.M.) -p2X.T.X.) w . E.R.(M.T.M.) -p2X.T.X. E.R.(M.T.M.) -p2X.T.X.= p ( 1 - p ) diag (X.T.X.) . Γ = diag (X.T.X.)1 / 2 ∥ Γ w∥2=wT.diag (X.T.X.) w
quelle