Statistiken und Big Data

8
Punktanalyse ändern

Könnte mir bitte jemand den Änderungspunkt erklären. Ich verwende das Paket in R und verstehe nicht wirklich, was die verschiedenen Methoden bedeuten, welche Vor- und Nachteile sie haben, und ich verstehe insbesondere den Strafwert nicht. Was bedeutet das, wenn Sie den Strafwert erhöhen, und was...

8
Sind Binning-Daten vor der Pearson-Korrelation gültig?

Ist es akzeptabel, Bin-Daten zu erstellen, den Mittelwert der Bins zu berechnen und dann den Pearson-Korrelationskoeffizienten auf der Grundlage dieser Mittelwerte abzuleiten? Es scheint mir ein etwas faul zu sein, wenn (wenn Sie sich die Daten als Bevölkerungsstichprobe vorstellen) die Streuung...

8
Naive Bayes über kontinuierliche Variablen

Bitte erlauben Sie mir, eine grundlegende Frage zu stellen. Ich verstehe die Mechanik von Naive Bayes für diskrete Variablen und kann die Berechnungen "von Hand" wiederholen. (Code von HouseVotes84 ganz unten). Ich habe jedoch Schwierigkeiten zu sehen, wie die Mechanik für kontinuierliche...

8
Große Cox-Regression mit R (Big Data)

Ich versuche, eine Cox-Regression für einen Beispieldatensatz von 2.000.000 Zeilen wie folgt mit nur R auszuführen. Dies ist eine direkte Übersetzung eines PHREG in SAS. Die Stichprobe ist repräsentativ für die Struktur des Originaldatensatzes. ## library(survival) ### Replace 100000 by...

8
Wie kombiniere ich mehrere unterstellte Datensätze?

Ich benötige einen einzelnen unterstellten Datensatz (z. B. um einen Ländergruppen-Dummy aus den unterstellten Pro-Kopf-Einkommensdaten des Landes zu erstellen). R bietet ein Paketpaket zum Erstellen mehrerer unterstellter Daten (z. B. Amelia) und zum Kombinieren von Ergebnissen aus mehreren...