Der univariate exponentielle Hawkes-Prozess ist ein aufregender Punktprozess mit einer Ereignisankunftsrate von: λ ( t ) = μ + ∑tich< tα e- β( t - tich)λ(t)=μ+∑ti<tαe−β(t−ti) \lambda(t) = \mu +
Der univariate exponentielle Hawkes-Prozess ist ein aufregender Punktprozess mit einer Ereignisankunftsrate von: λ ( t ) = μ + ∑tich< tα e- β( t - tich)λ(t)=μ+∑ti<tαe−β(t−ti) \lambda(t) = \mu +
Das Schätzen von Parametern unter Verwendung der Maximum-Likelihood-Schätzung (MLE) umfasst das Bewerten der Likelihood-Funktion, die die Wahrscheinlichkeit des Auftretens der Stichprobe (X) auf Werte (x) im Parameterraum (θ) bei gegebener Verteilungsfamilie (P (X = x | θ) abbildet Alle Beispiele,...
Ich versuche, mit optimden Ergebnissen einer einfachen linearen Regression mit zu reproduzierenglm oder sogar nlsR-Funktionen ausgestattet ist. Die Parameterschätzungen sind die gleichen, aber die Restvarianzschätzung und die Standardfehler der anderen Parameter sind nicht die gleichen,...
Die ungefähre Bayes'sche Berechnung ist eine wirklich coole Technik, um im Grunde jedes stochastische Modell anzupassen, das für Modelle gedacht ist, bei denen die Wahrscheinlichkeit schwer zu bestimmen ist (Sie können beispielsweise aus dem Modell eine Stichprobe ziehen, wenn Sie die Parameter...
Ich bin verwirrt über die Maximum-Likelihood-Methode im Vergleich zB zur Berechnung des arithmetischen Mittels. Wann und warum liefert die maximale Wahrscheinlichkeit "bessere" Schätzungen als z. B. das arithmetische Mittel? Wie ist das
Was sind die Vor- und Nachteile beider
Jeffrey Wooldridge sagt in seiner ökonometrischen Analyse von Querschnitts- und Paneldaten (Seite 357), dass der empirische Hessische Wert "für die bestimmte Stichprobe, mit der wir arbeiten, nicht garantiert positiv oder sogar positiv semidefinit ist". Dies erscheint mir falsch, da (abgesehen von...
Verschiedene Beschreibungen zur Modellauswahl für zufällige Effekte von linearen gemischten Modellen weisen an, REML zu verwenden. Ich kenne den Unterschied zwischen REML und ML auf einer bestimmten Ebene, aber ich verstehe nicht, warum REML verwendet werden sollte, weil ML voreingenommen ist. Ist...
Das Phänomen der "Überdispersion" in einem GLM tritt immer dann auf, wenn wir ein Modell verwenden, das die Varianz der Antwortvariablen einschränkt, und die Daten eine größere Varianz aufweisen, als es die Modellbeschränkung zulässt. Dies tritt häufig bei der Modellierung von Zähldaten mit einem...
Was ist die häufigste Meinung zu der Voltmeter-Geschichte und ihren Variationen? Die Idee dahinter ist, dass eine statistische Analyse, die sich auf hypothetische Ereignisse bezieht, überarbeitet werden muss, wenn später festgestellt wird, dass diese hypothetischen Ereignisse nicht wie angenommen...
Allgemeine Frage Nehmen wir an, wir haben iid-Daten x1x1x_1 , x2x2x_2 , ... einströmen. Wir möchten die maximale Wahrscheinlichkeitsschätzung von \ boldsymbol {\ theta} rekursiv berechnen. . Das heißt, nachdem \ hat {\ boldsymbol {\ theta}} _ {n-1} = \ underset {\ boldsymbol {\ theta} \ in \ mathbb...
Für ein gegebenes Inferenzproblem wissen wir, dass sich ein Bayes'scher Ansatz normalerweise sowohl in der Form unterscheidet als auch aus einem fequentistischen Ansatz resultiert. Frequentisten (in der Regel auch ich) weisen häufig darauf hin, dass für ihre Methoden keine vorherige Verwendung...
Im ersten Kapitel des Buches Algebraische Geometrie und Statistische Lerntheorie, das sich mit der Konvergenz von Schätzungen in verschiedenen Funktionsräumen befasst, wird erwähnt, dass die Bayes'sche Schätzung der Schwartz-Verteilungstopologie entspricht, während die Maximum-Likelihood-Schätzung...
Ich frage mich, ob die Maximum-Likelihood-Schätzung jemals in der Statistik verwendet wurde. Wir lernen das Konzept, aber ich frage mich, wann es tatsächlich verwendet wird. Wenn wir die Verteilung der Daten annehmen, finden wir zwei Parameter, einen für den Mittelwert und einen für die Varianz,...
Diese Frage befasst sich mit der eingeschränkten Maximalwahrscheinlichkeitsschätzung (REML) in einer bestimmten Version des linearen Modells, nämlich: Y=X(α)β+ϵ,ϵ∼Nn(0,Σ(α)),Y=X(α)β+ϵ,ϵ∼Nn(0,Σ(α)), Y = X(\alpha)\beta + \epsilon, \\ \epsilon\sim N_n(0, \Sigma(\alpha)), Wobei eine durch ;...
Es scheint eine Menge Verwirrung im Vergleich zwischen der Verwendung von glmnetinside caretzur Suche nach einem optimalen Lambda und der Verwendung cv.glmnetderselben Aufgabe zu geben. Viele Fragen wurden gestellt, zB: Klassifizierungsmodell train.glmnet vs. cv.glmnet? Was ist der richtige Weg,...
Als Teil der Ausgabe eines verallgemeinerten linearen Modells werden die Null- und Restabweichung verwendet, um das Modell zu bewerten. Die Formeln für diese Größen werden häufig als Log-Wahrscheinlichkeit des gesättigten Modells ausgedrückt. Beispiel: /stats//a/113022/22199 , Logistic Regression:...
Diese Frage ergibt sich aus der Frage: Wann (wenn überhaupt) ist ein frequentistischer Ansatz wesentlich besser als ein bayesianischer? Wie ich in meiner Lösung zu dieser Frage geschrieben habe, müssen Sie meiner Meinung nach, wenn Sie ein Frequentist sind, nicht an das Wahrscheinlichkeitsprinzip...
θ^\hat\thetaθ∗\theta^*nn Sie ‖ θ - θ * ‖ ∥θ^−θ∗∥\lVert\hat\theta-\theta^*\rVertO ( 1 / √n )O(1/n−−√)O(1/\sqrt n)‖E θ -θ*‖∥Eθ^−θ∗∥\lVert \mathbb E\hat\theta - \theta^*\rVert‖E θ - θ ‖∥Eθ^−θ^∥\lVert \mathbb E\hat\theta - \hat\theta\rVertO(1/ √n )O(1/n−−√)O(1/\sqrt{n}) Ich interessiere mich für...
Ausgehend von einem Datensatz mit binären Ergebnissen und einer Prädiktormatrix schätzt das logistische Standardregressionsmodell die Koeffizienten , die die Binomialwahrscheinlichkeit maximieren. Wenn vollen Rang hat, ist eindeutig. Wenn keine perfekte Trennung vorliegt, ist sie...