Ich habe diesen Vergleich der analytischen Disziplinen und diese Perspektive des maschinellen Lernens durchlaufen , aber ich finde keine Antworten auf Folgendes:
- Wie hängt Data Science mit maschinellem Lernen zusammen?
- Wie hängt es nicht mit maschinellem Lernen zusammen?
machine-learning
definitions
knowledge-base
Subham Tripathi
quelle
quelle
Antworten:
Data Science ist ein viel umfassenderes Konzept als maschinelles Lernen. Es beginnt mit einer einfachen Datenvisualisierung und beschreibenden Statistiken, um Einblicke zu erhalten, Manipulationen wie Bereinigen, um Daten vorzubereiten. Bevor Sie einige ML-Algorithmen verwenden können.
Grundsätzlich liegen so große Stapel wie BigData, Visualisierung und Datenvorverarbeitung außerhalb des Bereichs des maschinellen Lernens. Und sie sind alle integraler Bestandteil von "Data Science".
Bild mit großer Auflösung: https://whatsthebigdata.files.wordpress.com/2013/07/datascientistmap.png
quelle
Maschinelles Lernen versucht, Systeme zu erstellen, die aus Daten lernen können. Als solches kann es in einer Vielzahl von Einstellungen verwendet werden, um beispielsweise Roboter das Laufen zu erlernen oder virtuelle Agenten für das Spielen von Videospielen zu schulen .
Die Datenwissenschaft befasst sich mit der Extraktion von Wissen aus Daten. Zu diesem Zweck werden verschiedene Techniken aus verschiedenen Disziplinen verwendet. Maschinelles Lernen umfasst einige Techniken, die für einen Datenwissenschaftler sehr nützlich sein können, wie z. B. Deep Learning, Entscheidungsbäume und verschiedene Clustering-Algorithmen. Maschinelles Lernen hat jedoch mehr zu bieten als Data Science und Data Science setzt nicht nur auf maschinelles Lernen.
quelle
Die Datenwissenschaft ist viel umfassender. Es ist eine Art Sammelbegriff, der im Moment ehrlich gesagt keine sehr klare Definition hat. Die Datenwissenschaft umfasst jedoch alle Fähigkeiten und Techniken, die erforderlich sind, um Daten zu verstehen, die eine hohe Geschwindigkeit (sie kommen schnell auf Sie zu), ein hohes Volumen (es gibt viel davon) oder eine Variabilität (sie ist chaotisch, wie die Verarbeitung natürlicher Sprache) aufweisen. Dies bedeutet, dass es sicherlich maschinelles Lernen und KI umfasst, aber es geht auch um die Tools, die in einer realen Situation wie SQL, Hadoop oder Spark verwendet werden können (und verwandte Informationen wie Kenntnisse der parallelen Programmierung). Darüber hinaus kann Data Science den Kommunikationsaspekt wie das Erstellen guter Diagramme und die Verwendung von Excel umfassen oder nicht.
Grundsätzlich ist Data Science ML +.
quelle
Data Science ist, wie andere angemerkt haben, ein viel weiter gefasster Begriff als maschinelles Lernen. Die Anwendung von Techniken des maschinellen Lernens ist ein Aspekt der Datenwissenschaft. Data Science ist im Allgemeinen die Wissenschaft, Wissen aus Daten abzuleiten. Der Begriff wurde bereits 1960 geprägt und weiterentwickelt, um den Ablauf und das Zusammenspiel von Problemdefinition, Datenerfassung, Datentransformation, Datenmodellierung / -analyse und Entscheidungsfindung zu beschreiben. Um Ihre Frage konkret zu beantworten:
quelle