Als «categorical-data» getaggte Fragen

9
Erhebungsmethode zu persönlichen Fragen

Ein statistischer Freund von mir erzählte mir von einer interessanten Technik, mit der ehrliche Antworten auf Umfragen erhalten wurden, die sich mit sensiblen Themen befassten. Ich erinnere mich an den allgemeinen Kern der Methode, frage mich aber, ob jemand die Details kennt und ob irgendwo darauf...

9
Führen Entscheidungsbäume eine Aufteilung von Knoten durch, indem sie in der Praxis kategoriale Werte in numerische Werte konvertieren?

Verwenden wir in Entscheidungsbäumen bei der Klassifizierung oder Regression nur numerische Werte? Angenommen, ich habe eine kategoriale Spalte Windals Feature. Angenommen , ich habe am 5 Zeilen (Beobachtungen) und die Werte für Windsind [ high, low, high, medium, medium]. Kann ich diese...

8
Testen gepaarter Frequenzen auf Unabhängigkeit

Ich hoffe, das ist nicht viel zu einfach oder überflüssig. Ich habe mich nach Rat umgesehen, bin mir aber bisher noch nicht sicher, wie ich vorgehen soll. Meine Daten bestehen aus Zählungen einer bestimmten Struktur, die in Gesprächen zwischen Gesprächspartnerpaaren verwendet werden. Die...

8
Post-hoc-Test in einer 2x3-ANOVA mit gemischtem Design unter Verwendung von SPSS?

Ich habe zwei Gruppen von 10 Teilnehmern, die während eines Experiments dreimal bewertet wurden. Um die Unterschiede zwischen den Gruppen und zwischen den drei Bewertungen zu testen, führte ich eine 2 × 3-ANOVA mit gemischtem Design mit group(Kontrolle, experimentell), time(erste, zweite, drei) und...

8
Gruppieren Sie kategoriale Variablen in glmnet

Betrachten Sie die folgende Passform: fit3a=glmnet(x,g4,family="multinomial",type.multinomial="grouped") Wie gebe ich an, welche Spalten xkategorisch / multinomial sind? Gibt es eine Option, um den Index der gruppierten Variablen anzugeben? In der Dokumentation wird die Option type.multinomialwie...

8
Warum würde ein statistisches Modell bei einem riesigen Datensatz überanpassen?

Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly...

8
Normalisierung von Dummy-Variablen

Meine Daten bestehen aus mehreren kontinuierlichen Messungen und einigen Dummy-Variablen, die die Jahre darstellen, in denen die Messungen durchgeführt wurden. Jetzt möchte ich ein neuronales Netzwerk mit den Daten lernen. Daher normalisiere ich zScore alle Variablen, einschließlich der...