Data Science

15
Satzähnlichkeitsvorhersage

Ich möchte das folgende Problem lösen: Ich habe eine Reihe von Sätzen als Datensatz, und ich möchte in der Lage sein, einen neuen Satz einzugeben und den Satz zu finden, der dem neuen Satz im Datensatz am ähnlichsten ist. Ein Beispiel würde so aussehen: Neuer Satz: " I opened a new mailbox"...

15
K-Means vs. Online K-Means

K-means ist ein bekannter Algorithmus zum Clustering, aber es gibt auch eine Online-Variante eines solchen Algorithmus (online K-means). Was sind die Vor- und Nachteile dieser Ansätze und wann sollte jeder bevorzugt

15
Ist Pandas jetzt schneller als data.table?

https://github.com/Rdatatable/data.table/wiki/Benchmarks-%3A-Grouping Die data.table-Benchmarks wurden seit 2014 nicht mehr aktualisiert. Ich habe gehört, dass sie Pandasjetzt schneller sind als data.table. Ist das wahr? Hat jemand irgendwelche Benchmarks gemacht? Ich habe Python noch nie benutzt,...

15
R: Maschinelles Lernen auf der GPU

Gibt es maschinelle Lernpakete für R, die die GPU nutzen können, um die Trainingsgeschwindigkeit zu verbessern (so etwas wie Theano aus der Python-Welt)? Ich sehe, dass es ein Paket namens gputools gibt, das die Ausführung von Code auf der GPU ermöglicht, aber ich suche nach einer vollständigeren...

15
Wie lerne ich neuronale Netze?

Ich bin ein Studienanfänger (ich erwähne das, damit Sie mir meine Unbekanntheit verzeihen können), der derzeit über neuronale Netze recherchiert. Ich habe ein neuronales Netzwerk mit drei Knoten (das funktioniert) gemäß den Anweisungen meines Professors codiert. Ich möchte jedoch eine Karriere in...

15
Data Science Tools mit Scala

Ich weiß, dass Spark vollständig in Scala integriert ist. Der Anwendungsfall ist speziell für große Datenmengen. Welche anderen Tools unterstützen Scala? Ist Scala am besten für größere Datensätze geeignet? Oder eignet es sich auch für kleinere