Statistiken und Big Data

8
Was sind einige Gründe, warum iterativ neu gewichtete kleinste Quadrate nicht konvergieren würden, wenn sie für die logistische Regression verwendet werden?

Ich habe die Funktion glm.fit in R verwendet, um Parameter an ein logistisches Regressionsmodell anzupassen. Standardmäßig verwendet glm.fit iterativ neu gewichtete kleinste Quadrate, um die Parameter anzupassen. Was sind einige Gründe, warum dieser Algorithmus bei Verwendung für die logistische...

8
Visualisierung und Überzeichnung: Alternative zu Streuungen

Ich habe eine große Menge von Länderdaten, die überfüllt sind (wie Sie unten sehen können), aber ich brauche die Beschriftungen und die Ausreißer - ich habe auch viele Grafiken, daher wäre es mühsam, das Fenster zurückzusetzen und einen falschen Datenpunkt hinzuzufügen für die Ausreißer. Gibt es...

8
Welche Abweichung verwendet glmnet, um Werte von zu vergleichen ?

Ein Kriterium für die Auswahl des optimalen Wertes von mit einem elastischen Netz oder einer ähnlichen bestraften Regression besteht darin, eine Auftragung der Abweichung gegen den Bereich von und auszuwählen, wenn die Abweichung minimiert ist (oder innerhalb eines Standardfehlers von Minimum).λ λ...

8
Bei negativen AIC-Werten

Meine Frage bezieht sich auf den Thread Negative Werte für AIC im allgemeinen gemischten Modell . Ich bekomme oft negative AIC-Werte von der Software, die ich benutze. Ich merke es am meisten, wenn ich Zeitreihen mache. Aber hier ist was ich nicht verstehe. Bei der Definition des AIC gefällt das A...

8
Das Wahlvorhersagemodell von Nate Silver

Nate Silver war in der Vergangenheit recht erfolgreich darin, die Ergebnisse von US-Wahlen vorherzusagen, was in seinem Buch The Signal and the Noise beschrieben wird . Das Buch enthält einige Beschreibungen des verwendeten Modells, und ein Blogbeitrag von ihm beschreibt das Modell, das für die...

8
Probleme mit der Ausreißererkennung

In einem Blogbeitrag schreibt Andrew Gelman : Die schrittweise Regression ist eines dieser Dinge, wie die Erkennung von Ausreißern und Kreisdiagramme, die bei Nicht-Statistikern beliebt zu sein scheinen, von Statistikern jedoch als Scherz angesehen werden. Ich verstehe den Verweis auf...

8
Finden Sie die Verteilung und transformieren Sie sie in die Normalverteilung

Ich habe Daten, die beschreiben, wie oft ein Ereignis während einer Stunde stattfindet ("Anzahl pro Stunde", nph) und wie lange die Ereignisse dauern ("Dauer in Sekunden pro Stunde", dph). Dies sind die Originaldaten: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008,...