Als «synthetic-data» getaggte Fragen

23
Bester Begriff für erfundene Daten?

Ich schreibe ein Beispiel und habe einige Daten erfunden. Ich möchte, dass dem Leser klar wird, dass es sich nicht um echte Daten handelt, aber ich möchte auch nicht den Eindruck von Böswilligkeit erwecken, da dies nur als Beispiel dient. Es gibt keine (Pseudo-) Zufallskomponente für diese...

10
Warum haben Anova () und drop1 () unterschiedliche Antworten für GLMMs geliefert?

Ich habe ein GLMM der Form: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Wenn ich benutze drop1(model, test="Chi"), erhalte ich andere Ergebnisse als wenn ich Anova(model, type="III")aus dem Autopaket oder benutze summary(model). Diese...

8
Warum würde ein statistisches Modell bei einem riesigen Datensatz überanpassen?

Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly...