Statistiken und Big Data

25
Einführungslesung zu Copulas

Seit einiger Zeit bin ich auf der Suche nach einer guten Einführung in Copulas für mein Seminar. Ich finde viel Material, das über theoretische Aspekte spricht, was gut ist, aber bevor ich darauf eingehe, versuche ich, ein gutes intuitives Verständnis für das Thema aufzubauen. Könnte jemand eine...

25
Ist R lebensfähig für den (implementierten) Produktionscode?

Ich habe eine Reihe von Artikeln gelesen, in denen es um Unternehmen wie Google, Facebook und viele andere geht, die R für Forschungszwecke verwenden. Das andere Szenario, über das ich gelesen habe, ist, dass Unternehmen R verwenden, um eine Analyselösung zu prototypisieren und sie dann in einer...

25
Einführung in die Kausalanalyse

Was sind gute Bücher, die die Kausalanalyse einführen? Ich denke an eine Einführung, die sowohl die Prinzipien der Kausalanalyse erklärt als auch zeigt, wie verschiedene statistische Methoden verwendet werden könnten, um diese Prinzipien

25
Gibt es eine "Hallo Welt" für statistische Grafiken?

In der Computerprogrammierung gibt es ein klassisches erstes Programm zum Lernen / Lehren einer neuen Sprache oder eines neuen Systems, das "Hallo Welt" heißt. http://en.wikipedia.org/wiki/Hello_world_program Gibt es eine klassische erste Datenvisualisierung für die Verwendung eines Grafikpakets?...

25
LSA vs. PCA (Dokumentenclustering)

Ich untersuche verschiedene Techniken, die beim Clustering von Dokumenten zum Einsatz kommen, und möchte einige Zweifel in Bezug auf PCA (Principal Component Analysis) und LSA (Latent Semantic Analysis) klären. Erste Sache - was sind die Unterschiede zwischen ihnen? Ich weiß, dass in PCA die...

25
Zeichnung aus Dirichlet-Verteilung

Nehmen wir an, wir haben eine Dirichlet-Verteilung mit dem dimensionalen . Wie kann ich aus dieser Verteilung eine Stichprobe (einen dimensionalen Vektor) ziehen? Ich brauche eine (möglicherweise) einfache Erklärung.KKKα⃗ = [ α1, α2, . . . , αK]α→=[α1,α2,...,αK]\vec\alpha = [\alpha_1,...

25
Wie verwende ich R prcomp-Ergebnisse für die Vorhersage?

Ich habe einen data.frame mit 800 obs. von 40 Variablen, und möchte die Ergebnisse meiner Vorhersage mithilfe der Hauptkomponentenanalyse verbessern (was bisher mit Support Vector Machine an 15 handverlesenen Variablen am besten funktioniert). Ich verstehe, dass ein prcomp mir helfen kann, meine...