Sowohl der quadratische Mittelwert als auch die durchschnittliche absolute Abweichung scheinen die Maße für die Größe der Variabilität zu sein (insbesondere wenn die Variablen sowohl + ve als auch -ve sind). Wie lauten die Faustregeln, um eine davon der anderen vorzuziehen?
regression
standard-deviation
Mohit Ranka
quelle
quelle
Antworten:
Theoretisch sollte dies dadurch bestimmt werden, wie wichtig Fehler unterschiedlicher Größe für Sie sind, oder mit anderen Worten, Ihre Verlustfunktion .
In der realen Welt steht die Benutzerfreundlichkeit an erster Stelle. Daher sind RMS-Abweichungen (oder die damit verbundenen Abweichungen) einfacher zu kombinieren und in einem Durchgang einfacher zu berechnen, während durchschnittliche absolute Abweichungen für Ausreißer robuster sind und für mehr Verteilungen existieren. Die grundlegende lineare Regression und viele ihrer Ableger basieren auf der Minimierung von RMS-Fehlern.
Ein weiterer Punkt ist, dass der Mittelwert die RMS-Abweichungen minimiert, während der Median die absoluten Abweichungen minimiert. Möglicherweise bevorzugen Sie eine davon.
quelle