Wie hängt Data Science mit maschinellem Lernen zusammen?

Antworten:

6

Data Science ist ein viel umfassenderes Konzept als maschinelles Lernen. Es beginnt mit einer einfachen Datenvisualisierung und beschreibenden Statistiken, um Einblicke zu erhalten, Manipulationen wie Bereinigen, um Daten vorzubereiten. Bevor Sie einige ML-Algorithmen verwenden können.

Grundsätzlich liegen so große Stapel wie BigData, Visualisierung und Datenvorverarbeitung außerhalb des Bereichs des maschinellen Lernens. Und sie sind alle integraler Bestandteil von "Data Science".

Bild mit großer Auflösung: https://whatsthebigdata.files.wordpress.com/2013/07/datascientistmap.png

IharS
quelle
Wo ist das Bild in Originalgröße zu finden?
Walter Tross
4

Maschinelles Lernen versucht, Systeme zu erstellen, die aus Daten lernen können. Als solches kann es in einer Vielzahl von Einstellungen verwendet werden, um beispielsweise Roboter das Laufen zu erlernen oder virtuelle Agenten für das Spielen von Videospielen zu schulen .

Die Datenwissenschaft befasst sich mit der Extraktion von Wissen aus Daten. Zu diesem Zweck werden verschiedene Techniken aus verschiedenen Disziplinen verwendet. Maschinelles Lernen umfasst einige Techniken, die für einen Datenwissenschaftler sehr nützlich sein können, wie z. B. Deep Learning, Entscheidungsbäume und verschiedene Clustering-Algorithmen. Maschinelles Lernen hat jedoch mehr zu bieten als Data Science und Data Science setzt nicht nur auf maschinelles Lernen.

cdwoelk
quelle
3

Die Datenwissenschaft ist viel umfassender. Es ist eine Art Sammelbegriff, der im Moment ehrlich gesagt keine sehr klare Definition hat. Die Datenwissenschaft umfasst jedoch alle Fähigkeiten und Techniken, die erforderlich sind, um Daten zu verstehen, die eine hohe Geschwindigkeit (sie kommen schnell auf Sie zu), ein hohes Volumen (es gibt viel davon) oder eine Variabilität (sie ist chaotisch, wie die Verarbeitung natürlicher Sprache) aufweisen. Dies bedeutet, dass es sicherlich maschinelles Lernen und KI umfasst, aber es geht auch um die Tools, die in einer realen Situation wie SQL, Hadoop oder Spark verwendet werden können (und verwandte Informationen wie Kenntnisse der parallelen Programmierung). Darüber hinaus kann Data Science den Kommunikationsaspekt wie das Erstellen guter Diagramme und die Verwendung von Excel umfassen oder nicht.

Grundsätzlich ist Data Science ML +.

RAM
quelle
3

Data Science ist, wie andere angemerkt haben, ein viel weiter gefasster Begriff als maschinelles Lernen. Die Anwendung von Techniken des maschinellen Lernens ist ein Aspekt der Datenwissenschaft. Data Science ist im Allgemeinen die Wissenschaft, Wissen aus Daten abzuleiten. Der Begriff wurde bereits 1960 geprägt und weiterentwickelt, um den Ablauf und das Zusammenspiel von Problemdefinition, Datenerfassung, Datentransformation, Datenmodellierung / -analyse und Entscheidungsfindung zu beschreiben. Um Ihre Frage konkret zu beantworten:

  1. Maschinelles Lernen unterstützt die Datenwissenschaft, indem es eine Reihe von Algorithmen für die Datenmodellierung / -analyse (durch Schulung von Algorithmen für maschinelles Lernen), Entscheidungsfindung (durch Streaming, Online-Lernen, Echtzeit-Tests, die alle Themen des maschinellen Lernens sind) und bereitstellt gleichmäßige Datenaufbereitung (Algorithmen für maschinelles Lernen erkennen automatisch Anomalien in den Daten).
  2. Data Science fügt eine Reihe von Ideen / Algorithmen aus dem maschinellen Lernen zusammen, um eine Lösung zu erstellen, und leiht sich dabei viele Ideen aus der traditionellen Statistik, dem Fachwissen und der grundlegenden Mathematik aus. Auf diese Weise ist Data Science der Prozess der Lösung eines Anwendungsfalls, der eine Lösung im Gegensatz zum maschinellen Lernen bietet, das ein wichtiger Bestandteil dieser Lösung ist.
Nitesh
quelle