Statistiken und Big Data

52
Clustering mit einer Distanzmatrix

Ich habe eine (symmetrische) Matrix M, die den Abstand zwischen jedem Knotenpaar darstellt. Zum Beispiel, ABCDEFGHIJKL A 0 20 20 20 40 60 60 60 100 120 120 120 B 20 0 20 20 60 80 80 80 120 140 140 140 C 20 20 0 20 60 80 80 80 120 140 140 140 D 20 20 20 0 60 80 80 80 120 140 140 140 E 40 60 60 60...

52
Excel als Statistik-Workbench

Es scheint, dass viele Leute (einschließlich mir) gerne explorative Datenanalysen in Excel durchführen. Einige Einschränkungen, wie z. B. die Anzahl der Zeilen, die in einer Tabelle zulässig sind, sind problematisch, machen es jedoch in den meisten Fällen nicht unmöglich, Excel zum Herumspielen von...

52
Herleitung der Lasso-Lösung in geschlossener Form

Für das Lasso-Problem so dass . Ich sehe oft das Ergebnis der schwachen Schwelle \ beta_j ^ {\ text {lasso}} = \ mathrm {sgn} (\ beta ^ {\ text {LS}} _ j) (| \ beta_j ^ {\ text {LS}} |) - \ gamma) ^ + für den orthonormalen X- Fall. Es wird behauptet, dass die Lösung "leicht gezeigt" werden kann,...

52
Warum kümmern wir uns so sehr um normalverteilte Fehlerterme (und Homoskedastizität) in der linearen Regression, wenn wir das nicht müssen?

Ich nehme an, dass ich jedes Mal frustriert bin, wenn ich jemanden sagen höre, dass die Nichtnormalität von Residuen und / oder Heteroskedastizität gegen die OLS-Annahmen verstößt. Zur Schätzung von Parametern in einem OLS-Modell ist nach dem Gauß-Markov-Theorem keine dieser Annahmen erforderlich....

51
Statistik und kausale Folgerung?

In seiner Arbeit "Statistics and Causal Inference" von 1984 hat Paul Holland eine der grundlegendsten Fragen in der Statistik aufgeworfen: Was kann ein statistisches Modell über die Kausalität aussagen? Dies führte zu seinem Motto: KEINE URSACHE OHNE MANIPULATION in denen die Bedeutung...

51
Was ist eine gute Ressource für das Tischdesign?

Ich habe verschiedene theoretische Behandlungen von Grafiken gesehen, wie zum Beispiel die Grammatik der Grafiken . Aber ich habe in Bezug auf Tabellen nichts Vergleichbares gesehen. Im Laufe der Zeit habe ich ein informelles Modell für bewährte Praktiken bei der Tischgestaltung entwickelt. Ich...