Ich habe eine Frage zur Berechnung des James-Stein-Schrumpfungsfaktors in dem 1977 erschienenen Scientific American Paper von Bradley Efron und Carl Morris, "Stein's Paradox in Statistics" .
Ich habe die Daten für die Baseballspieler gesammelt und sie sind unten angegeben:
Name, avg45, avgSeason
Clemente, 0.400, 0.346
Robinson, 0.378, 0.298
Howard, 0.356, 0.276
Johnstone, 0.333, 0.222
Berry, 0.311, 0.273
Spencer, 0.311, 0.270
Kessinger, 0.289, 0.263
Alvarado, 0.267, 0.210
Santo, 0.244, 0.269
Swoboda, 0.244, 0.230
Unser, 0.222, 0.264
Williams, 0.222, 0.256
Scott, 0.222, 0.303
Petrocelli, 0.222, 0.264
Rodriguez, 0.222, 0.226
Campaneris, 0.200, 0.285
Munson, 0.178, 0.316
Alvis, 0.156, 0.200
avg45
ist der Durchschnitt nach bei Fledermäusen und wird im Artikel mit bezeichnet . avgSeason
ist das Ende der Saison durchschnittlich.
Der James-Stein-Schätzer für den Durchschnitt ( ) ist gegeben durch z = ˉ y + c ( y - ˉ y ) und der Schrumpfungsfaktor c ist gegeben durch (Seite 5 des Scientific American 1977-Artikels)
Dabei ist die Anzahl der unbekannten Mittel. Hier gibt es 18 Spieler, also . Ich kann mit Werten berechnen. Aber ich weiß nicht, wie ich berechnen soll . Die Autoren sagen für den gegebenen Datensatz c = 0,212 .k = 18 ≤ ( y - ≤ y ) 2 σ 2avg45
Ich habe versucht, und σ 2 y für σ 2 zu verwenden, aber sie geben nicht die richtige Antwort von c = 0,212
Kann jemand so freundlich sein, mir mitzuteilen, wie für diesen Datensatz berechnet wird ?
Antworten:
Der Parameter ist die (unbekannte) gemeinsame Varianz der Vektorkomponenten, von denen wir annehmen, dass sie normalverteilt sind. Für die Baseballdaten haben wir 45 ⋅ Y i ∼ b i n o m ( 45 , p i ) , also ergibt sich die normale Annäherung an die Binomialverteilung (unter ^ p i = Y i )σ2 45⋅Yi∼binom(45,pi) pi^=Yi
Offensichtlich in diesem Fall sind die Abweichungen nicht gleich, doch wenn sie auf einen gemeinsamen Wert gleich gewesen waren dann könnten wir es mit dem gepoolten Schätzer schätzen σ 2 = p ( 1 - p ) wobei p der Gesamtmittelwert ist p =1
Sie können dies mit dem folgenden R-Code überprüfen. Hier sind die Daten:
und hier ist die Schätzung für :σ2
Welches ist , σ 2 ≈ 0,004332392 . Der Schrumpfungsfaktor im Papier beträgt dannσ^2≈0.004332392
quelle
B. Efron & C. Morris (1975). Datenanalyse mit dem Steinschen Schätzer und seinen Verallgemeinerungen. Journal of the American Statistical Association, 70 (350), 311-319 (Link zum pdf)
oder detaillierter
B. Efron & C. Morris (1974). Datenanalyse mit dem Steinschen Schätzer und seinen Verallgemeinerungen. R-1394-OEO, The RAND Corporation, März 1974 (Link zu pdf) .
Auf Seite 312 sehen Sie, dass Efron & Morris eine Arc-Sin-Transformation dieser Daten verwendet, sodass die Varianz der Schlagmittelwerte ungefähr eins ist:
Das sind also die Werte des Stein-Schätzers. Für Clemente erhalten wir .290, was der .294 aus dem Artikel von 1977 ziemlich nahe kommt.
quelle