Statistiken und Big Data

22
Warum PCA von Daten mittels SVD der Daten?

In dieser Frage geht es um eine effiziente Methode zur Berechnung von Hauptkomponenten. Viele Texte zur linearen PCA befürworten die Verwendung der Singulärwertzerlegung der fallweisen Daten . Das heißt, wenn wir Daten und wollen die Variablen (seine ersetzen Spalten ) von Hauptkomponenten, wir tun...

22
Clustering einer binären Matrix

Ich habe eine halbkleine Matrix mit binären Features der Dimension 250k x 100. Jede Zeile ist ein Benutzer, und die Spalten sind binäre "Tags" für ein bestimmtes Benutzerverhalten, z. B. "likes_cats". user 1 2 3 4 5 ... ------------------------- A 1 0 1 0 1 B 0 1 0 1 0 C 1 0 0 1 0 Ich möchte die...

22
Was kann man nach Casella & Berger lernen?

Ich bin ein reiner Mathematik-Student mit wenig Hintergrundwissen in angewandter Mathematik. Seit dem letzten Herbst habe ich Unterricht in Casella & Bergers Buch genommen und hunderte (230+) Seiten mit Übungsproblemen in dem Buch abgeschlossen. Im Moment bin ich bei Kapitel 10. Da ich mich...