Statistiken und Big Data

10
Einwände gegen die Randomisierung

In klinischen Studien - eine methodologische Perspektive , schreibt Steven Piantadosi (Kap. 13, S. 334): In Kapitel 2 habe ich die Einwände von Abel und Koch (1997) und Urbach (1993) gegen die Randomisierung zur Kenntnis genommen und darauf hingewiesen, dass es sich lohnt, ihre Bedenken und...

10
Zufällige Gesamtstruktur für gruppierte Daten

Ich verwende zufällige Gesamtstruktur für hochdimensionale gruppierte Daten (50 numerische Eingabevariablen), die eine hierachische Struktur haben. Die Daten wurden mit 6 Replikationen an 30 Positionen von 70 verschiedenen Objekten gesammelt, was zu 12600 Datenpunkten führte, die nicht unabhängig...

10
Baumgröße in Gradientenbaumverstärkung

Die von Friedman vorgeschlagene Erhöhung des Gradientenbaums verwendet Entscheidungsbäume mit JEndknoten (= Blätter) als Basislerner. Es gibt eine Reihe von Möglichkeiten, einen Baum mit genau JKnoten zu züchten, zum Beispiel kann man den Baum in der Tiefe zuerst oder in der Breite zuerst züchten,...

10
Fehlende Werte in der Antwortvariablen in JAGS

Gelman & Hill (2006) sagen: In Bugs können fehlende Ergebnisse in einer Regression einfach behandelt werden, indem einfach der Datenvektor, die NAs und alle eingeschlossen werden. Bugs modellieren die Ergebnisvariable explizit. Daher ist es trivial, dieses Modell zu verwenden, um fehlende...

10
Erklärung der statistischen Simulation

Ich bin kein Statistiker. Also, bitte ertragen Sie meine Fehler, wenn überhaupt. Würden Sie bitte auf einfache Weise erklären, wie die Simulation durchgeführt wird? Ich weiß, dass es eine zufällige Stichprobe aus einer Normalverteilung auswählt und zur Simulation verwendet. Aber verstehe nicht...