Statistiken und Big Data

9
Doanes Formel für das Histogramm-Binning

Ich implementiere verschiedene Algorithmen, um die beste Anzahl von Bins für Histogramme zu schätzen. Die meisten von mir implementierten sind auf der Wikipedia-Seite "Histogramm" im Abschnitt " Anzahl der Fächer und Breite " * beschrieben. Ich habe ein Problem mit Doanes Formel: 1 + log(n) +...

9
Ockhams Rasiermesser veraltet?

Ich habe Vapniks Bücher über statistisches Lernen gesehen ... Ich habe die ersten Kapitel gelesen. Was mich jedenfalls am meisten überraschte, war, dass er dachte, das Rasiermesser des Occam sei veraltet. Ich dachte, es hängt mit der Situation zusammen, in der die Annahme einer höheren Dimension...

9
Robuste mittlere Schätzung mit O (1) -Updateeffizienz

Ich suche eine robuste Schätzung des Mittelwerts, der eine bestimmte Eigenschaft hat. Ich habe eine Reihe von Elementen, für die ich diese Statistik berechnen möchte. Dann füge ich nacheinander neue Elemente hinzu und möchte für jedes weitere Element die Statistik neu berechnen (auch als...

9
Quadratsummen vom Typ III

Ich habe ein lineares Regressionsmodell mit einer kategorischen Variable (männlich und weiblich) und einer kontinuierlichen Variable .AAABBB Ich habe Kontrastcodes in R mit eingerichtet options(contrasts=c("contr.sum","contr.poly")). Und jetzt habe ich Quadratsummen vom Typ III für , und deren...

9
Gauß-Markov-Theorem: BLAU und OLS

Ich habe den Guass-Markov-Satz auf Wikipedia gelesen und gehofft, jemand könnte mir helfen, den Hauptpunkt des Satzes herauszufinden. Wir nehmen an, dass ein lineares Modell in Matrixform gegeben ist durch: und wir suchen nach BLAU, .y=Xβ+ηy=Xβ+η y = X\beta +\eta βˆβ^ \widehat\beta Gemäß dieser ,...

9
Wie interpretiere ich den Interaktionsterm in der lm-Formel in R?

In R, wenn ich die lm()Funktion folgendermaßen aufrufe: lm.1 = lm(response ~ var1 + var2 + var1 * var2) summary(lm.1) Das gibt mir ein lineares Modell der Antwortvariablen mit var1, var2und die Interaktion zwischen ihnen. Wie genau interpretieren wir den Interaktionsterm jedoch numerisch? Die...