Statistiken und Big Data

9
Wie ordne ich 2D-Daten neu an, um eine Korrelation zu erhalten?

Ich habe den folgenden einfachen Datensatz mit zwei kontinuierlichen Variablen; dh: d = data.frame(x=runif(100,0,100),y = runif(100,0,100)) plot(d$x,d$y) abline(lm(y~x,d), col="red") cor(d$x,d$y) # = 0.2135273 Ich muss die Daten so umordnen, dass die Korrelation zwischen Variablen ~ 0,6 beträgt....

9
Knoten für ein GAM auswählen

Bei der Auswahl einer geeigneten Anzahl von Knoten für ein GAM sollte möglicherweise die Anzahl der Daten und Inkremente auf der x-Achse berücksichtigt werden. Was ist, wenn wir 100 Inkremente auf der x-Achse mit 1000 Datenpunkten bei jedem Inkrement haben? Die Info hier sagt: Wenn sie nicht...

9
Wie überprüft man die Ursache?

Nachdem wir gezeigt haben, dass zwei Größen korreliert sind, wie schließen wir daraus, dass die Beziehung kausal ist? Und außerdem was verursacht was? Theoretisch kann man nun eine "zufällige Zuordnung" (was auch immer das richtige Wort ist) verwenden, um eventuelle Unfallbindungen zwischen zwei...

9
Trimmmittelwert gegen Median

Ich habe einen Datensatz mit allen Anrufen bei einem Rettungsdienst und den Reaktionszeiten der Krankenwagenabteilung. Sie gaben zu, dass es einige Fehler bei den Antwortzeiten gibt, da es Fälle gibt, in denen sie nicht mit der Aufnahme begonnen haben (der Wert ist also 0) oder in denen sie die Uhr...