Ich frage mich, was ist ein innerer Wert der Verwendung des harmonischen Mittelwerts (zum Beispiel zur Berechnung von F-Maßen) im Gegensatz zum gewichteten arithmetischen Mittelwert bei der Kombination von Präzision und Erinnerung? Ich denke, dass der gewichtete arithmetische Durchschnitt die Rolle des harmonischen Mittelwerts spielen könnte, oder fehlt mir etwas?
12
Antworten:
Im Allgemeinen werden harmonische Mittel bevorzugt, wenn versucht wird, Raten anstelle ganzer Zahlen zu mitteln. Im Fall eines F1-Maßes bestraft ein harmonisches Mittel sehr kleine Präzisionen oder Rückrufe, während das ungewichtete arithmetische Mittel dies nicht tut. Stellen Sie sich einen Durchschnitt von 100% und 0% vor: Der arithmetische Mittelwert beträgt 50% und der harmonische Mittelwert 0%. Das harmonische Mittel erfordert, dass sowohl Präzision als auch Rückruf hoch sind.
Wenn die Genauigkeit und der Rückruf nahe beieinander liegen, liegt das harmonische Mittel nahe am arithmetischen Mittel. Beispiel: Das harmonische Mittel von 95% und 90% beträgt 92,4% im Vergleich zum arithmetischen Mittel von 92,5%.
Ob dies eine wünschenswerte Eigenschaft ist, hängt wahrscheinlich von Ihrem Anwendungsfall ab, wird jedoch normalerweise als gut angesehen.
Beachten Sie schließlich, dass das harmonische Mittel, wie @whuber in den Kommentaren feststellte, tatsächlich ein gewichtetes arithmetisches Mittel ist.
quelle
Das harmonische Mittel kann ein praktischer Ersatz für das arithmetische Mittel sein, wenn dieses keine Erwartung oder keine Varianz hat. Es kann tatsächlich der Fall sein, dass nicht existiert oder unendlich ist, während existiert. Zum Beispiel hat die Pareto-Verteilung mit der Dichte keine Endlichkeit Erwartung bei , was impliziert, dass das arithmetische Mittel eine unendliche Erwartung hat, während was impliziert, dass das harmonische Mittel eine endliche Erwartung hat.E[X] E[1/X]
Umgekehrt gibt es Verteilungen, für die das harmonische Mittel keine Erwartung hat, wie zum Beispiel die Beta -Verteilung bei . Und viele mehr, für die es keine Varianz gibt.Be(α,β) α≤1
Es gibt auch eine Verbindung mit Monte-Carlo-Näherungen zu Integralen und insbesondere zu normalisierenden Konstanten, basierend auf der Bayes'schen posterioren Identität wobei eine beliebige Dichte ist, der Prior ist, die Wahrscheinlichkeit und der Rand, wie in dieser anderen Frage zu X diskutiert , validiert, wo ich auf die Gefahren der Verwendung dessen, was Radford Neal (U Toronto) den schlechtesten Monte-Carlo-Schätzer aller Zeiten nennt , kommentiere . (Ich habe auch mehrere Einträge in meinem Blog zu diesem Thema geschrieben.)
quelle