Berechnung der Wahrscheinlichkeit aus RMSE

13

Ich habe ein Modell zur Vorhersage einer Trajektorie (x als Funktion der Zeit) mit mehreren Parametern. Im Moment berechne ich den quadratischen Fehler (RMSE) zwischen der vorhergesagten und der experimentell aufgezeichneten Flugbahn. Derzeit minimiere ich diesen Unterschied (RMSE) mit simplex (fminsearch in matlab). Während diese Methode funktioniert, um gute Anpassungen zu erhalten, möchte ich mehrere verschiedene Modelle vergleichen. Ich denke, ich muss die Wahrscheinlichkeit berechnen, damit ich die maximale Wahrscheinlichkeitsschätzung verwenden kann, anstatt den RMSE zu minimieren (und dann die Modelle mit AIC oder BIC zu vergleichen) ). Gibt es eine Standardmethode dafür?

Jason
quelle

Antworten:

20

Der quadratische Mittelwertfehler und die Wahrscheinlichkeit hängen eng zusammen. Angenommen, Sie haben einen Datensatz von Paaren und möchten deren Beziehung mit dem Modell f modellieren . Sie beschließen, den quadratischen Fehler zu minimieren{xi,zi}f

i(f(xi)zi)2

Ist diese Wahl nicht völlig willkürlich? Sicher, Sie wollen Schätzungen, die völlig falsch sind, mehr bestrafen als solche, die in etwa richtig sind. Es gibt jedoch einen sehr guten Grund, den quadratischen Fehler zu verwenden.

Erinnern Sie sich an die Gaußsche Dichte: wobeiZdie Normalisierungskonstante ist, um die wir uns momentan nicht kümmern. Nehmen wir an, dass Ihre Zieldatenznach einem Gaußschen verteilt sind. So können wir die Wahrscheinlichkeit der Daten aufschreiben.1Zexp(xμ)22σ2Zz

L=i1Zexp(f(xi)zi)22σ2

Nun, wenn Sie den Logarithmus davon nehmen ...

logL=i(f(xi)zi)22σ2logZ

... es stellt sich heraus, dass es sehr eng mit dem Effektivwert zusammenhängt: Die einzigen Unterschiede sind einige konstante Terme, eine Quadratwurzel und eine Multiplikation.

Kurz gesagt: Die Minimierung des quadratischen Durchschnittsfehlers entspricht der Maximierung der Protokollwahrscheinlichkeit der Daten.

bayerj
quelle
Danke für die klare Erklärung. Wenn ich also zwei (nicht eingebettete) Modelle mit BIC vergleichen möchte, kann ich bei der Berechnung der Wahrscheinlichkeit einfach die Sigma ^ 2- und Z-Terme löschen (vorausgesetzt, sie sind für alle Modelle gleich).
Jason
Ja. Beide Begriffe hängen nur von abσ, so können Sie sie fallen lassen, wenn beide σs sind gleich.
Bayerj
1
Ich denke, es gibt einen Fehler im letzten Schritt oben (das Protokoll der Wahrscheinlichkeit nehmen), es sollte sein:
logL=i(f(xi)zi)22σ2logZ
This doesn't change the "bottom line" because the log likelihood is linearly related to the RMSE, so minimizing RMSE is equivalent to minimizing log likelihood
Jason
2
Is there a negative sign missing in the Gaussian distribution?
Manoj
1
Shouldn't the conclusion be the opposite? Minimizing the sum of squared errors maximizes the log-likelihood (for a fixed σ), and thus maximizes the likelihood (since log is monotonic).
Tim Goodman