Statistiken und Big Data

13
Verständnis AIC und Schwarz-Kriterium

Ich betreibe ein Logistikmodell. Der tatsächliche Modelldatensatz enthält mehr als 100 Variablen, aber ich wähle einen Testdatensatz aus, in dem sich etwa 25 Variablen befinden. Davor habe ich auch einen Datensatz mit 8-9 Variablen erstellt. Mir wurde gesagt, dass AIC- und SC-Werte verwendet werden...

13
Interpretation / Verwendung der Kerneldichte

Dies mag eine naive Frage sein, aber hier geht. Wenn ich über einen Satz empirischer Daten verfüge und eine Kerneldichte an ihn anpasse und dann einen neuen Einzelwert erhalte, der möglicherweise aus demselben Prozess stammt, der den ursprünglichen Datensatz generiert hat, kann ich eine...

13
Median der Medianberechnung

Ich erstelle eine Reihe von Immobilienberichten, und der Medianpreis wird häufig angegeben, insbesondere von der NAR (National Association of Realtors). Wie ich am besten beurteilen kann, erhalten sie nur die Mediane der Immobilienpreise aus jedem Bereich. Meine Frage ist, wie der nationale Median...

13
LARS gegen Koordinatenabstieg für das Lasso

Welche Vor- und Nachteile hat die Verwendung von LARS [1] im Vergleich zur Verwendung der Koordinatenabsenkung für die Anpassung der L1-regulierten linearen Regression? Ich interessiere mich hauptsächlich für Leistungsaspekte (meine Probleme sind Nin der Regel Hunderttausende und p<20). Es sind...