Statistiken und Big Data

10
Wie vergleiche ich zwei oder mehr Korrelationsmatrizen?

Ich habe Korrelationsmatrizen die mit Sätzen von Daten (beobachtet) unter Verwendung der MATLAB-Funktion berechnet wurden .PPP(n×n)(n×n)(n \times n)PPP(m×n)(m×n)(m \times n)corrcoef Wie vergleiche und analysiere ich diese Korrelationsmatrizen zueinander?PPP Was sind die Tests, Methoden und / oder...

10
Kalman-Filter vs. Glättungskeile

F: Für welche Daten ist es geeignet, Zustandsraummodellierung und Kalman-Filterung zu verwenden, anstatt Splines zu glätten und umgekehrt? Gibt es eine Äquivalenzbeziehung zwischen den beiden? Ich versuche ein umfassendes Verständnis dafür zu bekommen, wie diese Methoden zusammenpassen. Ich habe...

10
Leistung für zwei Proben t Test

Ich versuche, die Leistungsberechnung für den Fall des t-Tests mit zwei unabhängigen Stichproben zu verstehen (ohne gleiche Varianzen anzunehmen, also habe ich Satterthwaite verwendet). Hier ist ein Diagramm, das ich gefunden habe, um den Prozess zu verstehen: Also nahm ich an, dass angesichts der...

10
Gute Praktiken bei der Vorhersage von Zeitreihen

Ich arbeite seit Monaten an kurzfristigen Lastprognosen und der Verwendung von Klima- / Wetterdaten, um die Genauigkeit zu verbessern. Ich habe einen Informatik-Hintergrund und aus diesem Grund versuche ich, keine großen Fehler und unfairen Vergleiche mit Statistik-Tools wie ARIMA-Modellen zu...

10
So führen Sie eine ROC-Analyse in R mit einem Cox-Modell durch

Ich habe einige Cox-Regressionsmodelle erstellt und möchte sehen, wie gut diese Modelle funktionieren. Ich dachte, dass möglicherweise eine ROC-Kurve oder eine c-Statistik nützlich sein könnte, ähnlich wie in diesem Artikel: JN Armitage und JH van der Meulen, "Identifizierung der Komorbidität bei...

10
Wie werden longitudinale Variablen gruppiert?

Ich habe eine Reihe von Variablen, die Längsschnittdaten von Tag 0 bis Tag 7 enthalten. Ich suche nach einem geeigneten Clustering-Ansatz, mit dem diese Längsschnittvariablen (keine Fälle) in verschiedene Gruppen gruppiert werden können. Ich habe versucht, diesen Datensatz zeitlich getrennt zu...

10
Statistiken für Online-Dating-Sites

Ich bin gespannt, wie ein Online-Dating-System Umfragedaten verwenden könnte, um Übereinstimmungen zu ermitteln. Angenommen, sie haben Ergebnisdaten aus vergangenen Spielen (z. B. 1 = glücklich verheiratet, 0 = kein 2. Datum). Nehmen wir als nächstes an, sie hätten zwei Präferenzfragen: "Wie sehr...