Statistiken und Big Data

9
"Da

Kurze Frage: Warum ist das so? Lange Frage: Ganz einfach, ich versuche herauszufinden, was diese erste Gleichung rechtfertigt. Der Autor des Buches, das ich gerade lese (Kontext hier, wenn Sie es wollen, aber nicht notwendig), behauptet Folgendes: Aufgrund der Annahme einer

9
Wie verwende ich R gbm mit Distribution = "adaboost"?

Die Dokumentation besagt, dass R gbm mit Distribution = "adaboost" für das 0-1-Klassifizierungsproblem verwendet werden kann. Betrachten Sie das folgende Codefragment: gbm_algorithm <- gbm(y ~ ., data = train_dataset, distribution = "adaboost", n.trees = 5000) gbm_predicted <-...

9
Inzidenzraten vergleichen

Ich möchte die Inzidenzraten zwischen zwei Gruppen vergleichen (eine ohne Krankheit und eine mit). Ich hatte vor, das Inzidenzratenverhältnis (IRR), dh die Inzidenzratengruppe B / Inzidenzratengruppe A, zu berechnen und dann zu testen, ob diese Rate gleich 1 ist, und schließlich 95% CI-Intervalle...

9
Konfidenzintervalle gegen Stichprobengröße?

Ich bin völlig neu in Statistiken und im Bereich der Konfidenzintervalle. Das könnte also sehr trivial sein oder sogar dumm klingen. Ich würde mich freuen, wenn Sie mir helfen könnten, Literatur / Text / Blog zu verstehen oder darauf hinzuweisen, die dies besser erklären. Ich sehe auf...

9
Ermittlung des größten Beitrags in einer Gruppe

Ich weiß nicht viel über Statistiken, also nimm sie mit. Nehmen wir an, ich habe 1000 Arbeiter. Ich möchte herausfinden, wer der härteste Arbeiter ist, aber ich kann nur den Arbeitsaufwand messen, der in Gruppen von 1 bis 100 Personen über eine Arbeitsstunde erledigt wird. Angenommen, jeder...

9
PCA-, ICA- und Laplace-Eigenkarten

Ich interessiere mich sehr für die Laplace-Eigenkartenmethode. Derzeit verwende ich es zur Dimensionsreduzierung für meine medizinischen Datensätze. Bei der Verwendung der Methode bin ich jedoch auf ein Problem gestoßen. Zum Beispiel habe ich einige Daten (Spektren-Signale), ich kann PCA (oder...

9
Verteilungen auf Teilmengen von ?

Ich frage mich, ob es Standardverteilungen für Teilmengen von Ganzzahlen . Entsprechend könnten wir dies als Verteilung auf einen Längenvektor von binären Ergebnissen ausdrücken , z. B. wenn dann entspricht dem Vektor .{1,2,...,J}{1,2,...,J}\{1, 2, ..., J\}JJJJ=5J=5J = 5{1,3,5}{1,3,5}\{1, 3,...