Ich implementiere eine Kreuzvalidierung und berechne Fehlermetriken wie RMSE, , MAE, MSE usw.
Können RMSE und MAE den gleichen Wert haben?
cross-validation
rms
mae
Perl
quelle
quelle
Antworten:
Ja, theoretisch. Der einfachste Fall, den ich mir vorstellen kann, ist ein Datensatz, bei dem alle Vorhersagefehler (dh Residuen) genau± 1 sind. RMSE und MAE geben identische Werte von 1 zurück. Man kann auch andere Szenarien konstruieren, aber keine scheint sehr wahrscheinlich.
EDIT: Dank an @DilipSarwate für den Hinweis (weiter ausgeführt von @ user20160 in ihrer ausgezeichneten Antwort), dass dieses Ergebnis genau dann möglich ist, wenn die absoluten Werte aller Vorhersagefehler identisch sind. Mit anderen Worten, der Wert± 1 ist in meinem Beispiel nichts Besonderes . Jede andere Zahl würde anstelle von 1 funktionieren.
quelle
Der mittlere absolute Fehler (MAE) kann unter bestimmten Bedingungen dem mittleren quadratischen Fehler (MSE) oder dem mittleren quadratischen Fehler (RMSE) entsprechen, was ich unten zeigen werde. Es ist unwahrscheinlich, dass diese Bedingungen in der Praxis auftreten.
Vorbereitungen
Seirich= | yich- y^ich| bezeichnen den absoluten Wert des Residuums für den ich ten Datenpunkt und sei r = [ rich, … , R.n]]T. ein Vektor, der absolute Residuen für alle n Punkte im Datensatz enthält. Wenn 1⃗ einen n × 1 Vektor von Einsen bezeichnet, können MAE, MSE und RMSE wie folgt geschrieben werden:
MSE
Wenn Sie die MSE gleich der MAE setzen und neu anordnen, erhalten Sie:
MSE und MAE sind für alle Datensätze gleich, bei denen die absoluten Residuen die obige Gleichung lösen. Zwei offensichtliche Lösungen sind:r = 0⃗ (es gibt keinen Fehler) und r = 1⃗ (die Residuen sind alle ± 1 , wie mkt erwähnt). Es gibt jedoch unendlich viele Lösungen.
Wir können Gleichung( 2 ) geometrisch wie folgt interpretieren : Die LHS ist das Punktprodukt von r - 1⃗ und r . Das Nullpunktprodukt impliziert Orthogonalität. MSE und MAE sind also gleich, wenn durch Subtrahieren von 1 von jedem absoluten Residuum ein Vektor erhalten wird, der orthogonal zu den ursprünglichen absoluten Residuen ist.
Durch Ausfüllen des Quadrats kann Gleichung( 2 ) wie folgt umgeschrieben werden:
Diese Gleichung beschreibt einen dimensionale Kugel, die bei [ 1] zentriert ist[ 12, … , 12]]T. mit Radius12n- -- -√ . MSE und MAE sind genau dann gleich, wenn die absoluten Residuen auf der Oberfläche dieser Hypersphäre liegen.
RMSE
Wenn Sie den RMSE gleich dem MAE einstellen und neu anordnen, erhalten Sie:
woich die Identitätsmatrix bin . Die Lösungsmenge ist der Nullraum von EIN ; das heißt, die Menge aller r so dass A r = 0⃗ . Um den Nullraum zu finden, beachten Sie, dass EIN eine n × n Matrix mit diagonalen Elementen gleich n - 1 und allen anderen Elementen gleich - 1 . Die Aussage A r = 0⃗ entspricht dem Gleichungssystem:
Oder Dinge neu ordnen:
RMSE und MAE sind also genau dann gleich, wenn die absoluten Werte der Residuen für alle Datenpunkte gleich sind.
quelle