Es gibt einige. In diesem Link finden Sie einen ausführlichen Vergleich
zu einer ungated Version des Papiers (richtige Referenz am Ende dieser Antwort).
Aufgrund der Einschränkungen des Problems beträgt die Aufschlüsselung des robustesten dieser Algorithmen (L / RMC) höchstens 12,5%. Ein Vorteil des L / RMC besteht darin, dass es auf Quantilen basiert und auch dann interpretierbar bleibt, wenn die zugrunde liegende Verteilung keine Momente aufweist. Ein weiterer Vorteil besteht darin, dass keine Symmetrie der Verteilung des nicht kontaminierten Teils der Daten zur Messung des Schwanzgewichts angenommen wird: Tatsächlich gibt der Algorithmus zwei Zahlen zurück: die RMC für das rechte Schwanzgewicht und die LMC für das linke Schwanzgewicht.
[ 0 , 1 ]Konstruktionsbedingt: Keine Kontaminationsmenge kann beispielsweise dazu führen, dass der Algorithmus -1 zurückgibt!). In der Praxis stellt man fest, dass man etwa 5% der Probe durch sehr pathologische Ausreißer ersetzen kann, ohne dass die am stärksten betroffenen Schätzungen (es gibt immer zwei) zu stark von dem Wert abweichen, den sie für die nicht kontaminierte Probe hatten.
Das L / RMC ist ebenfalls weit verbreitet. Zum Beispiel können Sie eine R Implementierung finden
hier . Wie in dem oben verlinkten Artikel erläutert, müssen Sie zur Berechnung des L / RMC den MC (den im Link implementierten Schätzer) für die linke und rechte Hälfte Ihrer Daten separat berechnen. Hier (links) rechts sind die Teilstichproben der Beobachtung (kleiner) größer als der Median Ihrer ursprünglichen Stichprobe.
- Brys, Hubert, Struyf. (2006). Robuste Maße des Schwanzgewichts.