Statistiken und Big Data

8
Ein Satz Erklärung des AIC für nichttechnische Typen

Ich brauche eine einsatzige Erklärung der Verwendung des AIC beim Modellbau. Bisher habe ich "Einfach ausgedrückt, der AIC ist ein relatives Maß für das Ausmaß der beobachteten Variation, die von verschiedenen Modellen berücksichtigt wird, und ermöglicht eine Korrektur der Komplexität des...

8
Fehlende Raten und mehrfache Anrechnung

Gibt es eine Grenze, die bei Verwendung der Mehrfachimputation (MI) am wenigsten akzeptabel ist? Kann ich beispielsweise MI verwenden, wenn die fehlenden Werte in einer Variablen 20% der Fälle ausmachen, während andere Variablen fehlende Werte aufweisen, jedoch nicht auf einem so hohen...

8
A priori Auswahl der SVM-Klassengewichte

Ich erinnere mich, dass ich irgendwo gesehen / gelesen habe, dass es für SVMs mit mehreren Klassen und unausgeglichenen Daten eine Möglichkeit gab, die Klassengewichte aus den Trainingsdaten zu bestimmen (anstatt aus der X-Validierung). Weiß jemand, was die Methode ist oder aus welchem ​​Papier sie...

8
Wie wird der Wert in einen p-Wert umgewandelt?

Ich bin brandneu in der Statistik und studiere die Mathematik hinter Split-Tests (A / B und multivariate). Ich habe gelernt, wie man mit gegebenen Testdaten berechnet, und ich verstehe, wie man dies über eine Tabelle in eine Wahrscheinlichkeit übersetzt, aber ich möchte die Wahrscheinlichkeit...

8
Basisklassifikatoren zum Boosten

Boosting-Algorithmen wie AdaBoost kombinieren mehrere "schwache" Klassifikatoren zu einem einzigen stärkeren Klassifikator. Obwohl theoretisch ein Boosting mit jedem Basisklassifikator möglich sein sollte, scheinen in der Praxis baumbasierte Klassifikatoren am häufigsten zu sein. Warum ist das?...

8
Bootstrap vs numerische Integration

Mein Verständnis des Bootstrap-Ansatzes basiert auf Wassermans Framework (fast wörtlich): Sei eine Statistik ( ist die aus der Verteilung gezogene iid-Stichprobe ). Angenommen , wir schätzen möchten - die Varianz der gegeben .X i F V F ( T n ) T n FT.n= g( X.1, . . . , X.n)Tn=g(X1,...,Xn)T_n =...