Ich möchte ein konzeptionelles Verständnis von Root Mean Squared Error (RMSE) und Mean Bias Deviation (MBD) erlangen. Nachdem ich diese Kennzahlen für meine eigenen Datenvergleiche berechnet habe, stellte ich oft verwirrt fest, dass der RMSE hoch ist (z. B. 100 kg), während der MBD niedrig ist (z. B. weniger als 1%).
Insbesondere suche ich eine Referenz (nicht online), die die Mathematik dieser Maße auflistet und diskutiert. Wie werden diese beiden Kennzahlen normalerweise berechnet, und wie soll ich sie in einem Artikel in einer Zeitschrift angeben?
Im Kontext dieses Beitrags wäre es sehr hilfreich, einen "Spielzeug" -Datensatz zu haben, mit dem die Berechnung dieser beiden Maße beschrieben werden kann.
Angenommen, ich möchte die Masse (in kg) von 200 Widgets ermitteln, die von einem Fließband erzeugt werden. Ich habe auch ein mathematisches Modell, das versucht, die Masse dieser Widgets vorherzusagen. Das Modell muss nicht empirisch sein und kann physisch basieren. Ich berechne den RMSE und den MBD zwischen den tatsächlichen Messungen und dem Modell und stelle fest, dass der RMSE 100 kg und der MBD 1% beträgt. Was bedeutet das konzeptionell und wie würde ich dieses Ergebnis interpretieren?
Nehmen wir nun an, dass ich aus dem Ergebnis dieses Experiments herausfinde, dass der RMSE 10 kg und der MBD 80% beträgt. Was bedeutet das und was kann ich zu diesem Experiment sagen?
Was bedeuten diese Maßnahmen und was bedeuten sie (zusammengenommen)? Welche zusätzlichen Informationen liefert der MBD, wenn er mit dem RMSE in Betracht gezogen wird?
quelle
Antworten:
Ich denke, diese Konzepte sind leicht zu erklären. Also beschreibe ich es lieber hier. Ich bin sicher, dass viele elementare Statistikbücher dies behandeln, einschließlich meines Buches "Die Grundlagen der Biostatistik für Ärzte, Krankenschwestern und Kliniker".
Denken Sie an ein Ziel mit einem Bullauge in der Mitte. Der mittlere quadratische Fehler entspricht der durchschnittlichen quadratischen Entfernung von einem Pfeil, der auf das Ziel und die Mitte geschossen wurde. Wenn Ihre Pfeile nun gleichmäßig in der Mitte verstreut sind, hat der Schütze keine Ausrichtung und der mittlere quadratische Fehler entspricht der Varianz.
Im Allgemeinen können sich die Pfeile jedoch um einen Punkt vom Ziel weg ausbreiten. Der durchschnittliche quadratische Abstand der Pfeile vom Mittelpunkt der Pfeile ist die Varianz. Dieses Zentrum könnte als Zielpunkt des Schützen angesehen werden. Die Entfernung von der Mitte oder dem Zielpunkt dieses Schützen zur Mitte des Ziels ist der absolute Wert der Abweichung.
Denken Sie an ein rechtwinkliges Dreieck, in dem das Quadrat der Hypotenuse die Summe der Quadrate der beiden Seiten ist. Ein quadratischer Abstand vom Pfeil zum Ziel ist also das Quadrat des Abstands vom Pfeil zum Zielpunkt und das Quadrat des Abstands zwischen der Mitte des Ziels und dem Zielpunkt. Wenn alle diese quadratischen Abstände gemittelt werden, ergibt sich der mittlere quadratische Fehler als Summe aus dem Biasquadrat und der Varianz.
quelle
RMSE ist eine Methode, um zu messen, wie gut unser Vorhersagemodell über den tatsächlichen Daten liegt. Je kleiner RMSE, desto besser verhält sich das Modell, wenn wir dies an einem neuen Datensatz getestet haben (nicht an unserem Trainingssatz) Ein RMSE von 0,37 über einen Bereich von 0 bis 1 führt zu vielen Fehlern im Vergleich zu einem RMSE von 0,01 als besseres Modell. BIAS dient der Über- oder Unterschätzung.
quelle
Soweit ich verstehen kann, gibt ein RMSE einen genaueren Wert des Fehlers zwischen Modell und beobachtetem, jedoch kann das BIAS zusätzlich zu einem Wert des Fehlers (weniger genau als das RMSE) auch bestimmen, ob das Modell ist positive oder negative Abweichung, wenn das Modell die beobachteten Werte unterschätzt oder überschätzt.
quelle