Statistiken und Big Data

9
Cooks Distanzgrenzwert

Ich habe die Entfernung des Kochs gelesen, um Ausreißer zu identifizieren, die einen großen Einfluss auf meine Regression haben. In Cooks ursprünglicher Studie sagt er, dass eine Cut-off-Rate von 1 vergleichbar sein sollte, um Influencer zu identifizieren. In verschiedenen anderen Studien wird...

9
Optimism Bias - Schätzungen des Vorhersagefehlers

Das Buch Elemente des statistischen Lernens (online als PDF verfügbar) behandelt die optimistische Tendenz (7.21, Seite 229). Es heißt, dass der Optimismus-Bias die Differenz zwischen dem Trainingsfehler und dem In-Sample-Fehler ist (Fehler, der beobachtet wird, wenn an jedem der ursprünglichen...

9
Anhaltende kontrastive Divergenz für RBMs

Wenn wir den persistenten CD-Lernalgorithmus für eingeschränkte Bolzmann-Maschinen verwenden, starten wir unsere Gibbs-Abtastkette in der ersten Iteration an einem Datenpunkt, aber im Gegensatz zur normalen CD beginnen wir in den folgenden Iterationen nicht über unserer Kette. Stattdessen beginnen...