Wenn Sie als sortierte Version Ihrer Originaldaten , wird der Median wie folgt definiert:O1,O2,…,ONX1,X2,…,XN
Median({O1,O2,…,ON})={O(N+1)/2(ON/2+ON/2+1)/2if N is oddotherwise
Ohne Ihre Daten zu ordnen, können Sie die Definition des geometrischen Medians verwenden , um den Median in einer Dimension zu definieren:
Median({X1,X2,…,XN})=argminy∑i=1N∣∣Xi−y∣∣
Beachten Sie, dass dies nicht unbedingt einen eindeutigen Median definiert, wenn eine gerade Anzahl von Punkten vorhanden ist. Beispielsweise optimiert eine beliebige Zahl das Ziel mit .y∈[3,4]X={2,3,4,5}
Eine alternative Möglichkeit, den Mittelwert auszudrücken, ist die Schätzung der "kleinsten Quadrate":
Wenn Sie als Mittelwert wählen, erhalten Sie den kleinsten Wert der Summe der quadratischen Fehler.m
Nun kann der Median als Schätzung der "geringsten absoluten Abweichungen" ausgedrückt werden:
Wenn Sie als Median wählen, erhalten Sie den kleinsten Wert der Summe der absoluten Fehler.m
quelle
Der Median ist der Wert, der dem halben Quantil entspricht, dh die Hälfte der Werte ist höher, die Hälfte ist niedriger (entschuldigen Sie, dass ich Fälle mit Gleichheit ignoriere oder wenn die Menge gerade ist ...). das PDF des Datensatzes bekannt ist, kann die kumulative Verteilung leicht ausgewertet werden. Wenn Sie diese Funktion mit P_X , dann ist derpX X1⋅Xn PX
Nehmen Sie zum Beispiel den Fall für Winkel in dieser Methode, die in diesem Übersichtsartikel für den Histogrammausgleich verwendet werden. Das untere linke Feld zeigt das PDF der Winkel in einer Reihe natürlicher Bilder. ist die kumulative Verteilung und der Median ist der Wert von , der dem Wert entspricht, der in diesem Fall ungefähr ist.p(θ) P(θ) θ 1/2 0
quelle