Statistiken und Big Data

56
Herausforderungen zwischen Industrie und Kaggle. Ist es wichtiger, mehr Beobachtungen zu sammeln und Zugang zu mehr Variablen zu haben als ausgefallene Modelle?

Ich hoffe der Titel ist selbsterklärend. In Kaggle verwenden die meisten Gewinner das Stapeln mit manchmal Hunderten von Basismodellen, um ein paar Prozent mehr MSE und Genauigkeit zu erzielen. Generell ist es Ihrer Erfahrung nach wichtig, ausgefallene Modelle wie das Stapeln und nicht nur mehr...

55
Welche Pseudo-

Ich habe SPSSfür ein logistisches Regressionsmodell ausgegeben. Die Ausgabe meldet zwei Maßnahmen für das Modell fit, Cox & Snellund Nagelkerke. Welche dieser Kennzahlen würden Sie als Faustregel als passend melden?R2R²R^² Oder welcher dieser Anpassungsindizes ist derjenige, über den...

55
Wald-Test für logistische Regression

Nach meinem Verständnis wird der Wald-Test im Rahmen der logistischen Regression verwendet, um festzustellen, ob eine bestimmte Prädiktorvariable signifikant ist oder nicht. Die Nullhypothese, dass der entsprechende Koeffizient Null ist, wird verworfen.XXX Der Test besteht aus der Division des...