Ich bin ein R-Noob, der verschiedene Arten von Analysen für große Datenmengen in R durchführen muss. Als ich mich auf dieser Site und anderswo umsah, schien es mir, dass es hier viele esoterische und weniger bekannte Probleme gibt - wie zum Beispiel Welches Paket soll wann verwendet werden, welche Transformationen gelten für die Daten (nicht) usw.
Ich frage mich nur, ob es ein Buch / Tutorial / Handbuch gibt, das all dies entmystifiziert und die Informationen systematisch präsentiert. Ich mache das lieber, als mich umzuschauen und Informationen aus verschiedenen Quellen online zu sammeln.
Danke im Voraus.
r
large-data
TeachMeR
quelle
quelle
Antworten:
Hier sind einige Blog-Beiträge, die ich zu diesem Thema von Large Data Sets mit R verfasst habe. Es gibt einige Pakete wie ff und bigmemory, die den Dateiaustausch und die Speicherzuweisung verwenden. Einige andere Pakete nutzen die Konnektivität zu Datenbanken wie sqldf, RMySQL und RSQLite.
R Referenzen für den Umgang mit Big Data
Big Data Logistic Regression in R mit ODBC
quelle