Statistiken und Big Data

8
Ist das Simpsons Paradoxon im Titanic-Datensatz?

Mit dem bekannten Datensatz "Überleben der Passagiere auf der Titanic" bekomme ich ein seltsames Verhalten, wenn ich den Tarif gegen das Alter zeichne (siehe unten). Ohne eine Einschränkung für Pclass ist die Korrelation positiv. Im Gegensatz dazu scheinen die Korrelationen für alle Klassen negativ...

8
"T-Wert" in Verbindung mit nlme / lme4

Ich verstehe das Problem der Bestimmung der Freiheitsgrade in Mehrebenenmodellen; Daher ist die Entscheidung von Doug Bates et al. p-Werte nicht als Teil des lme4-Pakets in R zu melden. Ganz zu schweigen von der Fülle von Problemen mit und der unangemessenen Konzentration auf p-Werte im...

8
Wie robust ist der Maximum-Likelihood-Schätzer bei der Modellierung von Strukturgleichungen gegenüber einem Mangel an multivariater Normalität?

In einem Strukturgleichungsmodell wird häufig der ML-Schätzer verwendet. Kann ML verwendet werden, wenn die Variablen nicht multivariat normal sind? Oft sind die Indikatoren, mit denen Sie arbeiten können, nicht multivariat normal. Ich bin mir nicht sicher, wie ich in diesem Fall vorgehen...

8
Selektionsbias bei Bäumen

In Applied Predictive Modeling von Kuhn und Johnson schreiben die Autoren: Schließlich leiden diese Bäume unter Selektionsverzerrungen: Prädiktoren mit einer höheren Anzahl unterschiedlicher Werte werden gegenüber detaillierteren Prädiktoren bevorzugt (Loh und Shih, 1997; Carolin et al., 2007;...