Statistiken und Big Data

27
Warum sollte man sich in Naive Bayes mit Laplace-Glättung beschäftigen, wenn das Testset unbekannte Wörter enthält?

Ich habe heute über die Naive Bayes-Klassifikation gelesen. Ich las unter der Überschrift Parameterschätzung mit add 1 Glättung : Verweisen Sie mit ccc auf eine Klasse (z. B. Positiv oder Negativ) und mit www auf ein Token oder Wort. Der Maximum - Likelihood - Schätzer für P(w|c)P(w|c)P(w|c) ist...

27
Was ist los mit t-SNE vs. PCA zur Dimensionsreduktion mit R?

Ich habe eine Matrix von 336x256 Gleitkommazahlen (336 Bakteriengenome (Spalten) x 256 normalisierte Tetranukleotidfrequenzen (Zeilen), z. B. addiert sich jede Spalte zu 1). Ich erhalte gute Ergebnisse, wenn ich meine Analyse mit der Hauptkomponentenanalyse durchführe. Zuerst berechne ich die...

27
Schön geschriebene Papiere

Aus David Salsburgs Buch The lady tasting tea : Obwohl der Leser es vielleicht nicht glaubt, spielt der literarische Stil in der mathematischen Forschung eine wichtige Rolle. Einige mathematische Autoren scheinen nicht in der Lage zu sein, leicht verständliche Artikel zu verfassen. Andere...

27
Wie beschreibt man Statistiken in einem Satz?

Als ich anfing, Statistiken zu lernen, schienen Verfahren wie der T-Test, die ANOVA, das Chi-Quadrat und die lineare Regression jeweils sehr unterschiedliche Wesen zu sein. Aber jetzt merke ich, dass diese Prozeduren mehr oder weniger dasselbe bewirken. Ebenso messen Werte wie Varianz, Residuen,...

27
Was sind die Auswirkungen der Auswahl verschiedener Verlustfunktionen bei der Klassifizierung auf einen ungefähren Verlust von 0 bis 1?

Wir wissen, dass einige objektive Funktionen einfacher zu optimieren sind und andere schwierig. Und es gibt viele Verlustfunktionen, die wir verwenden möchten, die aber schwer zu verwenden sind, zum Beispiel 0-1-Verlust. Wir finden also einige Proxy- Verlust-Funktionen, um die Arbeit zu erledigen....