Als «binning» getaggte Fragen

Binning bedeutet, eine kontinuierliche Variable in diskrete Kategorien zu gruppieren. Es wird insbesondere in Bezug auf Histogramme verwendet, könnte aber auch allgemeiner im Sinne einer Vergröberung verwendet werden.

10
R lineare Regression kategoriale Variable "versteckter" Wert

Dies ist nur ein Beispiel, auf das ich mehrmals gestoßen bin, daher habe ich keine Beispieldaten. Ausführen eines linearen Regressionsmodells in R: a.lm = lm(Y ~ x1 + x2) x1ist eine stetige Variable. x2ist kategorisch und hat drei Werte, z. B. "Niedrig", "Mittel" und "Hoch". Die von R gegebene...

9
Doanes Formel für das Histogramm-Binning

Ich implementiere verschiedene Algorithmen, um die beste Anzahl von Bins für Histogramme zu schätzen. Die meisten von mir implementierten sind auf der Wikipedia-Seite "Histogramm" im Abschnitt " Anzahl der Fächer und Breite " * beschrieben. Ich habe ein Problem mit Doanes Formel: 1 + log(n) +...

8
Sollten wir kontinuierliche Variablen ablegen?

Ich weiß, dass dies bereits gefragt wurde, und ich habe die Antworten auf die früheren Fragen zum Binning kontinuierlicher Variablen gelesen. Ich verstehe, dass wir generell das Binning vermeiden sollten, da dies möglicherweise dazu führt, dass nützliche Informationen (unter anderem) weggeworfen...

8
Sind Binning-Daten vor der Pearson-Korrelation gültig?

Ist es akzeptabel, Bin-Daten zu erstellen, den Mittelwert der Bins zu berechnen und dann den Pearson-Korrelationskoeffizienten auf der Grundlage dieser Mittelwerte abzuleiten? Es scheint mir ein etwas faul zu sein, wenn (wenn Sie sich die Daten als Bevölkerungsstichprobe vorstellen) die Streuung...