Konvexität
f( x )x∈Xx1∈Xx2∈X0≤λ≤1f(λx1+(1−λ)x2)≤λf(x1)+(1−λ)f(x2).
Es kann bewiesen werden, dass ein solches konvexes ein globales Minimum hat. Ein eindeutiges globales Minimum eliminiert Fallen, die durch lokale Minima erzeugt werden und in Algorithmen auftreten können, die versuchen, eine Konvergenz auf einem globalen Minimum zu erreichen, z. B. die Minimierung einer Fehlerfunktion.f(x)
Obwohl eine Fehlerfunktion in allen kontinuierlichen, linearen Kontexten und vielen nichtlinearen Kontexten 100% zuverlässig sein kann, bedeutet dies nicht die Konvergenz auf einem globalen Minimum für alle möglichen nichtlinearen Kontexte.
Mittlerer quadratischer Fehler
Gegeben ist eine Funktion , die das ideale Systemverhalten beschreibt, und ein Modell des Systems (wobei der Parametervektor, die Matrix, der Würfel oder der Hyperwürfel und ), das rational oder durch Konvergenz erstellt wurde (wie beim neuronalen Netztraining) kann die Funktion des mittleren quadratischen Fehlers (MSE) wie folgt dargestellt werden.s(x)a(x,p)p1≤n≤N
e(β):=N−1∑n[a(xn)−s(xn)]2
Das Material, das Sie lesen, behauptet wahrscheinlich nicht, dass oder in Bezug auf konvex sind , sondern dass in Bezug auf und konvex ist. egal was sie sind. Diese spätere Aussage kann für jedes stetige und bewiesen werden . a(x,p)s(x)xe(β)a(x,p)s(x)a(x,p)s(x)
Verwechslung des Konvergenzalgorithmus
Wenn die Frage ist, ob ein bestimmtes und eine Methode zum Erreichen eines , die sich dem innerhalb eines angemessenen MSE-Konvergenzspielraums annähert, verwechselt werden kann, lautet die Antwort "Ja". Deshalb ist MSE nicht das einzige Fehlermodell.a(x,p)s(x)a(x,p)
Zusammenfassung
Der beste Weg, um zusammenzufassen, ist, dass definiert oder aus einer Reihe von konvexen Fehlermodellen ausgewählt werden sollte, basierend auf den folgenden Erkenntnissen.e(β)
- Bekannte Eigenschaften des Systemss(x)
- Die Definition des Approximationsmodellsa(x,p)
- Tensor verwendet, um den nächsten Zustand in der konvergenten Sequenz zu erzeugen
Die Menge der konvexen Fehlermodelle umfasst aufgrund ihrer Einfachheit und Rechensparsamkeit zweifellos das MSE-Modell.