Als «descriptive-statistics» getaggte Fragen

Beschreibende Statistiken fassen Merkmale einer Stichprobe zusammen, wie z. B. Mittelwert und Standardabweichung, Median und Quartile, Maximum und Minimum. Kann bei mehreren Variablen Korrelationen und Kreuztabellen enthalten. Kann visuelle Anzeigen enthalten - Boxplots, Histogramme, Streudiagramme usw.

77
Ein Beispiel: LASSO-Regression unter Verwendung von glmnet für binäre Ergebnisse

Ich beginne mit der Verwendung von dabble glmnetmit LASSO Regression , wo mein Ergebnis von Interesse dichotomous ist. Ich habe unten einen kleinen nachgebildeten Datenrahmen erstellt: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45,...

34
Warum gibt es einen Unterschied zwischen der manuellen Berechnung eines Konfidenzintervalls für eine logistische Regression von 95% und der Verwendung der Funktion confint () in R?

Sehr geehrte Damen und Herren, mir ist etwas Merkwürdiges aufgefallen, das ich Ihnen nicht erklären kann. Zusammenfassend lässt sich sagen, dass der manuelle Ansatz zur Berechnung eines Konfidenzintervalls in einem logistischen Regressionsmodell und die R-Funktion confint()unterschiedliche...

29
Umgang mit hierarchischen / verschachtelten Daten beim maschinellen Lernen

Ich werde mein Problem mit einem Beispiel erklären. Angenommen, Sie möchten das Einkommen einer Person anhand einiger Attribute vorhersagen: {Alter, Geschlecht, Land, Region, Stadt}. Sie haben einen Trainingsdatensatz wie diesen train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3),...

27
Ist Variation gleich Varianz?

Dies ist meine erste Frage zu Cross Validated, also helfen Sie mir bitte, auch wenn sie trivial erscheint :-) Als erstes könnte die Frage auf Sprachunterschiede zurückzuführen sein, oder vielleicht habe ich echte Mängel in der Statistik. Trotzdem ist es hier: Sind Variation und Varianz in der...