Ich habe dieses Buch für meine Klasse Randomized Algorithms gelesen . In diesem Buch gibt es einen ganzen Abschnitt, der sich mit der Ermittlung des Medians eines Arrays durch Zufallsauswahl befasst und zu einem effizienteren Algorithmus führt. Jetzt wollte ich wissen, ob es neben einer theoretischen Verbesserung auch praktische Anwendungen dieses Algorithmus auf dem Gebiet der Informatik gibt. Gibt es Algorithmen oder Datenstrukturen, die den Median eines Arrays ermitteln müssen?
runtime-analysis
randomized-algorithms
Sharan Duggirala
quelle
quelle
Antworten:
Die Anwendung dieses Algorithmus ist trivial - Sie verwenden ihn immer dann, wenn Sie einen Median eines Datensatzes (also eines Arrays) berechnen möchten . Diese Daten können aus verschiedenen Bereichen stammen: astronomische Beobachtungen, Sozialwissenschaften, biologische Daten usw.
Es ist jedoch erwähnenswert, wann der Median dem Mittelwert (oder Modus) vorzuziehen ist. Grundsätzlich sind in der deskriptiven Statistik Mittelwert, Modus und Median gleich, dh sie stimmen überein, wenn unsere Daten vollkommen normalverteilt sind. Wenn andererseits unsere Daten verzerrt sind, dh die Häufigkeitsverteilung für unsere Daten ist (links / rechts) verzerrt, liefert der Mittelwert nicht den besten zentralen Ort, weil die Verzerrung ihn vom typischen Wert nach links oder rechts wegzieht Während der Median nicht so stark von den verzerrten Daten beeinflusst wird, behält er diese Position am besten bei und zeigt auf einen typischen Wert. Daher ist es möglicherweise besser, einen Median zu berechnen, wenn Sie mit verzerrten Daten arbeiten.
Auch beim maschinellen Lernen werden häufig statistische Methoden eingesetzt, zum Beispielk -medians-Clustering .
quelle
Medianfilterung ist bei der Reduzierung bestimmter Arten von Bildrauschen in der Bildverarbeitung üblich. Besonders Salz- und Pfeffergeräusche. Dies funktioniert, indem der Medianwert in jedem Farbkanal in jeder lokalen Umgebung des Bildes ausgewählt und durch diesen ersetzt wird. Wie groß diese Nachbarschaften sind, kann variieren. Beliebte Filtergrößen (Nachbarschaften) sind beispielsweise 3x3 und 5x5 Pixel.
quelle
Bei randomisierten Algorithmen ist die Berechnung des Medians besonders wichtig.
quelle
Der Median der Mediane hat einige Anwendungen:
quelle