Statistiken und Big Data

42
Warum Downsampling?

Angenommen, ich möchte einen Klassifikator lernen, der vorhersagt, ob es sich bei einer E-Mail um Spam handelt. Angenommen, nur 1% der E-Mails sind Spam. Am einfachsten ist es, den einfachen Klassifikator zu erlernen, der besagt, dass es sich bei keiner der E-Mails um Spam handelt. Dieser...

42
Was ist maxout im neuronalen Netz?

Kann jemand erklären, was maxout-Einheiten in einem neuronalen Netzwerk tun? Wie arbeiten sie und wie unterscheiden sie sich von herkömmlichen Einheiten? Ich habe versucht, das 2013 erschienene "Maxout Network" -Papier von Goodfellow et al. Zu lesen . (aus der Gruppe von Professor Yoshua Bengio),...

41
Welche Referenzen sollten angeführt werden, um die Verwendung von 30 als ausreichend große Stichprobe zu unterstützen?

Ich habe viele Male gelesen / gehört, dass die Stichprobengröße von mindestens 30 Einheiten als "große Stichprobe" angesehen wird (Normalitätsannahmen der Mittelwerte gelten normalerweise ungefähr aufgrund der CLT, ...). Daher generiere ich in meinen Experimenten normalerweise Proben von 30...

41
Regression: Variablen transformieren

Müssen Sie beim Transformieren von Variablen alle dieselbe Transformation verwenden? Kann ich zum Beispiel unterschiedlich transformierte Variablen auswählen, wie in: Sei Alter, Beschäftigungsdauer, Aufenthaltsdauer und Einkommen.x1,x2,x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3)...

41
Inwiefern unterscheiden sich Neigungsbewertungen von der Addition von Kovariaten in einer Regression, und wann werden sie letzteren vorgezogen?

Ich gebe zu, dass ich in Bezug auf Neigungsbewertungen und Kausalanalysen relativ neu bin. Eine Sache, die mir als Neuling nicht klar ist, ist, wie sich das "Ausbalancieren" unter Verwendung von Neigungsbewertungen mathematisch von dem unterscheidet, was passiert, wenn wir Kovariaten in einer...

41
OpenBugs vs. JAGS

Ich werde eine Umgebung im BUGS-Stil ausprobieren, um Bayes'sche Modelle zu schätzen. Gibt es wichtige Vorteile bei der Auswahl zwischen OpenBugs oder JAGS? Wird das eine in absehbarer Zeit das andere ersetzen? Ich werde den ausgewählten Gibbs-Sampler mit R verwenden. Ich habe noch keine...

41
Gute Spiele zum Erlernen des statistischen Denkens?

Gibt es Spiele, die den Spieler dazu bringen, "wie ein Statistiker zu denken"? Zum Beispiel bringt Sie Lightbot dazu, "wie ein Programmierer zu denken" (auf sehr einfache Weise). Gibt es Spiele, die für Unterhaltung oder Unterricht gedacht sind und dazu beitragen, dass man sich mit grundlegenden...

41
Wie werden F-Messwerte interpretiert?

Ich würde gerne wissen, wie man einen Unterschied von f-Messwerten interpretiert. Ich weiß, dass das f-Maß ein ausgewogenes Mittel zwischen Präzision und Erinnerung ist, aber ich frage nach der praktischen Bedeutung eines Unterschieds bei den f-Maßen. Wenn beispielsweise ein Klassifikator C1 eine...