Angenommen, ich versuche, eine große Anzahl von Parametern aus hochdimensionalen Daten mit einer Art regulierter Schätzungen abzuschätzen. Der Regularisierer führt einige Verzerrungen in die Schätzungen ein, aber es kann immer noch ein guter Kompromiss sein, da die Verringerung der Varianz dies mehr als wettmachen sollte.
Das Problem tritt auf, wenn ich Konfidenzintervalle abschätzen möchte (z. B. mithilfe von Laplace-Approximation oder Bootstrapping). Insbesondere führt die Verzerrung in meinen Schätzungen zu einer schlechten Abdeckung in meinen Konfidenzintervallen, was es schwierig macht, die frequentistischen Eigenschaften meines Schätzers zu bestimmen.
Ich habe einige Artikel gefunden, in denen dieses Problem diskutiert wurde (z. B. "Asymptotische Konfidenzintervalle bei der Gratregression basierend auf der Edgeworth-Erweiterung" ), aber die Mathematik ist meistens über meinem Kopf. In dem verlinkten Artikel scheinen die Gleichungen 92-93 einen Korrekturfaktor für Schätzungen zu liefern, die durch die Gratregression reguliert wurden, aber ich habe mich gefragt, ob es gute Verfahren gibt, die mit einer Reihe verschiedener Regularisierer funktionieren würden.
Auch eine Korrektur erster Ordnung wäre äußerst hilfreich.
quelle
Antworten:
Es gibt eine aktuelle erschienenen Artikel wird genau auf Ihre Frage eingegangen (wenn Sie, wie ich verstehe, eine Regression Ihrer Daten durchführen möchten), und es werden glücklicherweise leicht zu berechnende Ausdrücke bereitgestellt (Konfidenzintervalle und Hypothesentests für hochdimensionale Regression).
Vielleicht interessiert Sie auch die aktuelle Arbeit von Peter Bühlmann zu diesem Thema. Aber ich glaube, dass Sie mit dem ersten Artikel das bekommen, wonach Sie suchen, und der Inhalt ist leichter zu verdauen (ich bin auch kein Statistiker).
quelle
http://cran.r-project.org/web/packages/hdi/index.html
Ist es das, wonach du suchst?
quelle