Beim Lesen des Artikels "Forecasting at Scale" (FBProphet-Prognosetool, siehe https://peerj.com/preprints/3190.pdf ) bin ich auf den Begriff "sparse prior" gestoßen . Die Autoren erklären, dass sie einen solchen "spärlichen Prior" bei der Modellierung eines Vektors von Ratenabweichungen von einer skalaren Rate , die ein Modellparameter im logistischen Wachstumsmodell ist.
Verstehe ich richtig, dass "sparse" sich auf den Vektor bezieht, der Elemente nahe Null trägt, wenn der Parameter klein war , wenn sie dass ? Ich bin verwirrt, weil ich dachte, dass alle Vektorelemente Parameter der Regression sein müssen, aber wenn ich sie so definiere, bleiben nur die Parameter und als freie Modellparameter, nicht wahr?
Ist die Verwendung der Laplace-Verteilung auch zur Generierung der vorherigen Gemeinsamkeit? Ich verstehe nicht, warum es zB einer Normalverteilung vorgezogen wird.
quelle
Antworten:
Sparse-Daten sind Daten mit vielen Nullen. Hier scheinen die Autoren den Prior als spärlich zu bezeichnen, weil er die Nullen bevorzugt. Dies ist ziemlich selbsterklärend, wenn Sie sich die Form der Laplace-Verteilung (auch bekannt als doppelte Exponentialverteilung) ansehen, die einen Spitzenwert um Null aufweist.
(Bildquelle Tibshirani, 1996)
Aus diesem Grund wird Laplace Prior häufig als robuster Prior verwendet , der regulierend wirkt. Trotzdem ist der Laplace-Prior eine beliebte Wahl, aber wenn Sie wirklich spärliche Lösungen wünschen, gibt es möglicherweise bessere Entscheidungen, wie von Van Erp et al. (2019) beschrieben.
Van Erp, S., Oberski, DL & Mulder, J. (2019). Shrinkage Priors für Bayesian Penalized Regression. Journal of Mathematical Psychology, 89 , 31-50. doi: 10.1016 / j.jmp.2018.12.004
quelle