Ich evaluiere ein physikalisches Modell und möchte wissen, welche der Methoden ich hier anwenden soll (zwischen RMSE und Bestimmungskoeffizient R2)
Das Problem ist wie folgt: Ich habe eine Funktion, die Vorhersagen für den Eingabewert x ausgibt, . Ich habe auch die tatsächliche Beobachtung für diesen Wert, den ich .
Meine Frage ist, was sind die Vor- und Nachteile von RMSE oder . Ich habe beide in Zeitungen für das Problem gesehen, an dem ich arbeite.
This value shows how well future outcomes can be predicted by the model
- das ist extrem irreführend und neigt zu einfach falsch . Es gibt keine Garantie dafür, dass ein hoher Bestimmungskoeffizient in einem bestimmten Modell mit der Vorhersage zukünftiger Ergebnisse zusammenhängt.Unabhängig davon, welchen Fehlerwert Sie angeben, können Sie den vollständigen Ergebnisvektor in einem Anhang angeben. Personen, die gerne mit Ihrer Methode vergleichen, aber eine andere Fehlermessung bevorzugen, können diesen Wert aus Ihrer Tabelle ableiten.
:R2
Kann durch die leicht verständliche Formel ausgedrückt werden, in der Sie das Verhältnis der Summe der quadrierten Residuen aufbauen und durch den Mittelwert dividieren:
Wie bereits erwähnt, hängt die Auswahl möglicherweise von Ihrem Fachgebiet und dem Stand der Technik ab. Gibt es auch eine sehr akzeptierte Methode zum Vergleichen? Verwenden Sie die gleiche Messung wie sie, und Sie können die Vorteile Ihrer Methoden in der Diskussion direkt miteinander verknüpfen.
quelle
Ich würde Folgendes als eine sehr allgemeine Anleitung verwenden, um den Unterschied zwischen beiden Metriken zu verstehen:
Der RMSE gibt Ihnen einen Eindruck davon, wie nah (oder fern) Ihre vorhergesagten Werte von den tatsächlichen Daten sind, die Sie zu modellieren versuchen. Dies ist in einer Vielzahl von Anwendungen nützlich, in denen Sie die Genauigkeit und Präzision der Vorhersagen Ihres Modells verstehen möchten (z. B. Modellierung der Baumhöhe).
Vorteile
Nachteile
Vorteile
Nachteile
Natürlich unterliegt das Obige der Stichprobengröße und dem Stichprobenentwurf sowie dem allgemeinen Verständnis, dass Korrelation keine Kausalität impliziert.
quelle
Es gibt auch MAE, Mean Absolute Error. Im Gegensatz zu RMSE reagiert es nicht übermäßig auf große Fehler. Nach dem, was ich gelesen habe, bevorzugen einige Felder RMSE, andere MAE. Ich benutze gerne beide.
quelle
Damit statistische Wissenschaftler die beste Anpassung des Modells kennen, ist RMSE für die Personen in seiner robusten Forschung sehr wichtig. Wenn RMSE sehr nahe bei Null liegt, ist das Modell am besten angepasst.
Der Bestimmungskoeffizient ist gut für andere Wissenschaftler wie die Landwirtschaft und andere Bereiche. Es ist ein Wert zwischen 0 und 1. Wenn es 1 ist, stimmen 100% der Werte mit den beobachteten Datensätzen überein. Wenn es 0 ist, dann sind die Daten völlig heterogen. Dr.SK.Khadar Babu, VIT Universität, Vellore, Tamil Nadu, Indien.
quelle
Wenn zu jedem Element eines der Vektoren eine Zahl hinzugefügt wird, ändert sich RMSE. Gleich, wenn alle Elemente in einem oder beiden Vektoren mit einer Zahl multipliziert werden. R-Code folgt;
quelle
Letztendlich ist der Unterschied nur Standardisierung, da beide zur Wahl des gleichen Modells führen, da RMSE - mal die Anzahl der Beobachtungen im Zähler oder R - Quadrat ist und der Nenner des letzteren über alle Modelle hinweg konstant ist (zeichnen Sie einfach ein Maß gegen das andere für 10 verschiedene Modelle).
quelle