Statistiken und Big Data

10
Asymptotische Verteilung von Multinomial

Ich suche nach der begrenzten Verteilung der multinomialen Verteilung über d Ergebnisse. IE, die Verteilung der folgenden limn→∞n−12Xnlimn→∞n−12Xn\lim_{n\to \infty} n^{-\frac{1}{2}} \mathbf{X_n} Wobei XnXn\mathbf{X_n} eine Vektorwert-Zufallsvariable mit der Dichte fn(x)fn(x)f_n(\mathbf{x}) für...

10
Quantifizierung des QQ-Diagramms

Das qq-Diagramm kann verwendet werden, um zu visualisieren, wie ähnlich zwei Verteilungen sind (z. B. um die Ähnlichkeit einer Verteilung mit einer Normalverteilung zu visualisieren, aber auch um zwei Artibrary-Datenverteilungen zu vergleichen). Gibt es Statistiken, die ein objektiveres numerisches...

10
Omega im Quadrat für das Maß der Wirkung in R?

Das Statistikbuch, das ich lese, empfiehlt Omega-Quadrat, um die Auswirkungen meiner Experimente zu messen. Ich habe bereits unter Verwendung eines Split-Plot-Designs (Mischung aus Innersubjekten und Zwischensubjektdesign) bewiesen, dass meine Innersubjektfaktoren mit p <0,001 und F = 17...

10
Längsvergleich zweier Verteilungen

Ich habe die Testergebnisse einer Blutuntersuchung, die 2500 Personen viermal im Abstand von sechs Monaten verabreicht wurde. Die Ergebnisse bestehen hauptsächlich aus zwei Messungen der Immunantwort - eine in Gegenwart bestimmter Tuberkulose-Antigene, eine in Abwesenheit. Derzeit wird jeder Test...

10
Clusteranalyse gefolgt von Diskriminanzanalyse

Was ist der Grund, wenn überhaupt, die Diskriminanzanalyse (Discriminant Analysis, DA) für die Ergebnisse eines Clustering-Algorithmus wie k-means zu verwenden, wie ich es von Zeit zu Zeit in der Literatur sehe (im Wesentlichen zur klinischen Subtypisierung von psychischen Störungen)? Es wird im...

10
Wie gehe ich mit Umfragefragen mit Mehrfachantworten um?

Ich habe einen Datensatz, in dem Leute gefragt werden, ob sie an einem bestimmten Ort waren (z. B. A, B, C, D), und sie können mehr als eine Wahl treffen. Dann wird ihnen eine Probe aus der Nase entnommen, um festzustellen, ob sie mit einigen infiziert sind Krankheit. Ich muss das relative Risiko...

10
Was bedeutet

Was bedeutet ?∥a∥p=(∑ni=1|ai(t)|p)1p‖ein‖p=(∑ich=1n|einich(t)|p)1p\|a\|_p=\left(\sum _{i=1}^n \left|a_i(t)\right|{}^p\right){}^{\frac{1}{p}} Diese Formel wird auf der fünften Seite einer Zusammenfassung des verbesserten Datenstroms beschrieben: Die Count-Min-Skizze und ihre Anwendungen ( hier zu...

10
Übersetzen Sie R nach C ++ (eventuell mit Rcpp) [geschlossen]

Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Kreuz Validated. Geschlossen vor 2 Jahren . Ich würde gerne lernen, Rcpp zu...

10
Unterschied zwischen GLS und SUR

Ich habe einige über Generalized Least Squares (GLS) gelesen und versucht, sie mit meinem ökonometrischen Grundhintergrund zu verknüpfen. Ich erinnere mich, dass ich in der Graduiertenschule scheinbar unzusammenhängende Regression (SUR) verwendet habe, die GLS etwas ähnlich zu sein scheint. Ein...

10
Passt „glmnet“ in R zu einem Achsenabschnitt?

Ich passe ein lineares Modell in R an glmnet. Das ursprüngliche (nicht regulierte) Modell wurde unter Verwendung von angepasst lmund hatte keinen konstanten Term (dh es war in der Form lm(y~0+x1+x2,data)). glmnetnimmt eine Matrix von Prädiktoren und einen Vektor von Antworten. Ich habe die...