James-Stein-Schrumpfung in freier Wildbahn?

15

Ich bin von der Idee der James-Stein-Schrumpfung angetan (dh dass eine nichtlineare Funktion einer einzelnen Beobachtung eines Vektors möglicherweise unabhängiger Normalen ein besserer Schätzer für die Mittelwerte der Zufallsvariablen sein kann, wobei "besser" durch Quadratfehler gemessen wird ). Ich habe es jedoch noch nie in der angewandten Arbeit gesehen. Klar bin ich nicht gut genug gelesen. Gibt es klassische Beispiele, bei denen James-Stein die Schätzung in einem angewandten Umfeld verbessert hat? Wenn nicht, ist diese Art von Schrumpfung nur eine intellektuelle Neugier?

shabbychef
quelle

Antworten:

13

Der James-Stein-Schätzer ist nicht weit verbreitet, hat aber zu einem weichen und einem harten Schwellenwert geführt, der sehr weit verbreitet ist.

Die Schätzung der Wavelet-Schrumpfung (siehe R-Paket wavethresh) wird häufig bei der Signalverarbeitung verwendet. Der geschrumpfte Schwerpunkt (Paket pamr unter R) wird für die Klassifizierung von DNA-Mikroarrays verwendet. Es gibt viele Beispiele für die praktische Effizienz der Schrumpfung ...

Für theoretische Zwecke siehe den Abschnitt in Candes Review über die Schwindungsschätzung (S. 20-> James Stein und den Abschnitt danach, in dem es um weiche und harte Schwellenwerte geht):

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.161.8881&rep=rep1&type=pdf

EDIT aus den Kommentaren: Warum wird JS-Schrumpfung weniger verwendet als Soft / Hard Thresh?

James Stein ist schwieriger zu manipulieren (praktisch und theoretisch) und intuitiv zu verstehen als ein hartes Thresholding, aber die Warum-Frage ist eine gute Frage!

Robin Girard
quelle
Ich frage mich wohl, warum der James-Stein-Schätzer nicht weit verbreitet ist. Wird es von diesen anderen Techniken subsumiert oder sind die Bedingungen des Satzes in der Praxis nicht erfüllt?
Shabbychef
Dem Papier zufolge zitiere ich sowohl James Stein als auch Soft / Hard Thresholding, um Ungleichheiten im Orakel auszugleichen. Ich denke, James Stein ist schwieriger zu manipulieren und intuitiv zu verstehen als hartes Thresholding, aber die Warum-Frage ist eine gute Frage!
Robin Girard
13

Die Gratregression ist eine Form der Schrumpfung. Siehe Draper & Van Nostrand (1979) .

Die Schrumpfung hat sich auch bei der Schätzung saisonaler Faktoren für Zeitreihen als nützlich erwiesen. Siehe Miller und Williams (IJF, 2003) .

Rob Hyndman
quelle
+1 für dieses Papier! Meine Referenz für den Zusammenhang zwischen Schwellenwert und bestrafter Schätzung war google.fr/…
robin girard
11

Wie von anderen erwähnt, wird James-Stein nicht oft direkt verwendet, sondern ist das erste Papier zum Thema Schrumpfung, das seinerseits praktisch überall in der einfachen und mehrfachen Regression verwendet wird. Der Zusammenhang zwischen James-Stein und der modernen Schätzung wird in diesem Aufsatz von E.Candes ausführlich erläutert. Ich gehe auf Ihre Frage zurück und denke, James-Stein ist eine intellektuelle Nicht-Neugierde, in dem Sinne, dass sie zwar intellektuell war, die Statistik jedoch unglaublich störte, und niemand konnte sie später als Neugierde abtun. Alle hielten empirische Mittel für einen zulässigen Schätzer, und Stein bewies, dass sie mit einem Gegenbeispiel falsch lagen. Der Rest ist Geschichte.

gappy
quelle
5

Korbinian Strimmer verwendet den James-Stein-Schätzer, um auf Gennetzwerke zu schließen . Ich habe seine R-Pakete ein paar Mal verwendet und es scheint eine sehr gute und schnelle Antwort zu geben.

csgillespie
quelle
Ich mag seine Arbeit von 2008 über FDR. Ich benutze allerdings kein R :(
shabbychef