Statistiken und Big Data

14
k-bedeutet vs k-Median?

Ich weiß, dass es einen K-Mittelwert-Clustering-Algorithmus und einen K-Median gibt. Einer, der den Mittelwert als Mittelpunkt des Clusters verwendet, und der andere verwenden den Median. Meine Frage ist: wann / wo welche

14
Vertrauensbereiche für die QQ-Linie

Diese Frage bezieht sich nicht speziell auf R, aber ich habe sie gewählt, um sie Rzu veranschaulichen. Betrachten Sie den Code zum Erzeugen von Konfidenzbändern um eine (normale) qq-Linie: library(car) library(MASS) b0<-lm(deaths~.,data=road) qqPlot(b0$resid,pch=16,line="robust") Ich suche...

14
Angemessenheit der ANOVA nach k-Means-Cluster-Analyse

Die Meldung nach der ANOVA-Tabelle nach der K-Mittelwert-Analyse zeigt, dass Signifikanzniveaus nicht als Test gleicher Mittelwerte betrachtet werden sollten, da die Cluster-Lösung basierend auf dem euklidischen Abstand abgeleitet wurde, um den Abstand zu maximieren. Welchen Test sollte ich...

14
Item Response Theory vs. Confirmatory Factor Analysis

Ich habe mich gefragt, was die wichtigsten, bedeutungsvollen Unterschiede zwischen der Item-Response-Theorie und der Bestätigungsfaktor-Analyse sind. Ich verstehe, dass es Unterschiede in den Berechnungen gibt (der Schwerpunkt liegt eher auf Item vs. Covariances; log-linear vs. linear). Ich habe...

14
Beziehung zwischen Gamma und Chi-Quadrat-Verteilung

Wenn Y.= ∑i = 1NX2ichY.=∑ich=1NXich2Y=\sum_{i=1}^{N}X_i^2 wobei Xich∼ N( 0 , σ2)Xich∼N(0,σ2)X_i \sim \mathcal{N}(0,\sigma^2) , dh alle XichXichX_i sind, bedeuten normale Zufallsvariablen von Null mit gleichen Varianzen, dann Y∼Γ(N2,2σ2).Y.∼Γ(N2,2σ2).Y \sim \Gamma\left(\frac{N}{2},2\sigma^2\right)....

14
Was genau sind zensierte Daten?

Ich habe verschiedene Beschreibungen von zensierten Daten gelesen: A) Wie in diesem Thread erläutert , werden nicht quantifizierte Daten unterhalb oder oberhalb eines bestimmten Schwellenwerts zensiert. Nicht quantifiziert bedeutet, dass die Daten einen bestimmten Schwellenwert überschreiten oder...