Statistiken und Big Data

23
MSE-Zerlegung in Varianz und Bias-Quadrat

Indem gezeigt wird, dass MSE in Varianz plus das Quadrat der Abweichung zerlegt werden kann, hat der Beweis in Wikipedia einen Schritt, der im Bild hervorgehoben ist. Wie funktioniert das? Wie wird die Erwartung vom 3. bis zum 4. Schritt in das Produkt umgesetzt? Wenn die beiden Begriffe unabhängig...

23
Warum ist Lambda „innerhalb eines Standardfehlers vom Minimum“ ein empfohlener Wert für Lambda in einer elastischen Netto-Regression?

Ich verstehe, welche Rolle Lambda in einer elastischen Netzregression spielt. Und ich kann verstehen, warum man lambda.min auswählen würde, den Wert von lambda, der quervalidierte Fehler minimiert. Meine Frage ist, wo in der Statistikliteratur die Verwendung von Lambda.1se empfohlen wird, dh der...

23
Koordinate vs. Gefälle

Ich habe mich gefragt, was die verschiedenen Anwendungsfälle für die beiden Algorithmen Koordinatensinkflug und Gradientensinkflug sind . Ich weiß, dass der Koordinatenabstieg Probleme mit nicht glatten Funktionen hat, aber er wird in gängigen Algorithmen wie SVM und LASSO verwendet....