Statistiken und Big Data

8
Ist ein großer Unterschied in der Stichprobengröße zusammen mit einem Unterschied in den Varianzen für einen t-Test (oder Permutationstest) von Bedeutung?

Ich habe eine sehr verwirrende Frage. Ich habe Daten und möchte numerische Werte zwischen Männern und Frauen vergleichen. Es gibt einen großen Unterschied zwischen diesen beiden Gruppen: Die Anzahl der Männer beträgt 34, während die Anzahl der Frauen 310 beträgt und die Varianzen nicht gleich sind....

8
Verbinden der Punkte in einem Diagramm

Mit einem Diagramm, das das Produkt einer Gleichung ist, können wir alle Punkte, die die Gleichung lösen, und folglich auch eine Linie, die durch die Punkte verläuft, sinnvoll berechnen. Die Linie an jedem ihrer Punkte ist die Antwort. Aber was ist mit Maßnahmen wie "Anzahl der Autos pro Stunde /...

8
Ermittlung der am besten korrelierten Zeitreihen

Bevor ich frage, lese ich ähnliche Fragen, aber keine davon führt zu zufriedenstellenden Antworten für mein spezifisches Interesse. Ich möchte eine Klimazeitreihe der Niederschläge der Dominikanischen Republik über 64 Jahre (1940-2003) homogenisieren. Dafür ist es wirklich wichtig, eine...

8
Muss ich bei Verwendung von 'lmerTest' 'lme4' zitieren?

Ich verwende lmerTest, um lineare gemischte Modelle (LMM) auszuführen, um die p-Werte zu erhalten. In den Artikeln, die ich geschrieben habe, werden sie jedoch sowohl lme4als auch zeigen lmerTest. Dann bin ich mir nicht sicher, ob ich auch zitieren muss, lme4wenn ich nur lmerTestLMM-Modelle...

8
Was bedeutet "PCA (Principal Component Analysis) Sphären der Daten"?

Ich habe einige Notizen gelesen und es heißt, dass PCA "die Daten kugeln" kann. Was sie für mich als "Sphärieren der Daten" definieren, ist das Teilen jeder Dimension durch die Quadratwurzel des entsprechenden Eigenwerts. Ich gehe davon aus, dass mit "Dimension" jeder Basisvektor gemeint ist, in...

8
Variationsinferenzmaschinen

Nach einigen Recherchen zu diesem Thema habe ich ein überraschendes Defizit an Inferenzpaketen und Bibliotheken festgestellt, die auf Nachrichtenübermittlungs- oder Optimierungsmethoden für Python und R beruhen. Nach meinem besten Wissen sind diese Methoden äußerst nützlich. Zum Beispiel sollte für...