Statistiken und Big Data

36
Maschinelles Lernen: Soll ich für binäre Vorhersagen eine kategoriale Kreuzentropie oder einen binären Kreuzentropieverlust verwenden?

Zunächst wurde mir klar, dass ich, wenn ich binäre Vorhersagen durchführen muss, mindestens zwei Klassen durch Ausführen einer One-Hot-Codierung erstellen muss. Ist das richtig? Gilt die binäre Kreuzentropie jedoch nur für Vorhersagen mit nur einer Klasse? Wenn ich einen kategorialen...

35
Was ist eine gute Verwendung der 'Kommentar'-Funktion in R?

Ich habe gerade die commentFunktion in R entdeckt. Beispiel: x <- matrix(1:12, 3,4) comment(x) <- c("This is my very important data from experiment #0234", "Jun 5, 1998") x comment(x) Dies ist das erste Mal, dass ich diese Funktion besuche und mich frage, welche häufigen / nützlichen...

35
Begründung eines einseitigen Hypothesentests

Ich verstehe zweiseitige Hypothesentests. Sie haben H0:θ=θ0H0:θ=θ0H_0 : \theta = \theta_0 (vs. ). Der Wert ist die Wahrscheinlichkeit, dass Daten erzeugt, die mindestens so extrem sind wie die beobachteten. p θH1=¬H0:θ≠θ0H1=¬H0:θ≠θ0H_1 = \neg H_0 : \theta \ne \theta_0pppθθ\theta Ich verstehe keine...

35
Signifikanzwiderspruch in der linearen Regression: signifikanter t-Test für einen Koeffizienten gegenüber nicht signifikanter Gesamt-F-Statistik

Ich passe ein Modell mit mehreren linearen Regressionen zwischen 4 kategorialen Variablen (mit jeweils 4 Ebenen) und einer numerischen Ausgabe an. Mein Datensatz enthält 43 Beobachtungen. Die Regression gibt mir die folgenden Werte aus dem Test für jeden Steigungskoeffizienten: . Somit ist der...