Ich bin ein Mathe-Ph.D. Student, der daran interessiert ist, nach seinem Abschluss als Data Scientist in die Branche zu gehen. Ich werde kurz einige Hintergrundinformationen zu meiner Ausbildung geben, bevor ich meine Frage stelle, damit sie besser verstanden wird:
Mathe-Kursarbeit:
Dies geschah hauptsächlich in reiner Mathematik: Topologie, Funktionsanalyse usw., aber auch in angewandteren (auf die ich mich auf die Dissertation spezialisiert habe): konvexe Optimierung, nichtlineare Programmierung, numerische Analyse, lineare Programmierung, multiobjektive Optimierung. Außerdem habe ich momentan keine Kenntnisse über Inferenzstatistiken, bin aber zuversichtlich in die Wahrscheinlichkeitstheorie.
Programmierung:
Ich habe gerade einen einjährigen Kurs im Bachelor belegt, aber es waren hauptsächlich Mathematica und etwas Java, an das ich mich ehrlich gesagt nicht erinnere. In diesem Kurs enthielt der Inhalt weder Datenstrukturen noch den Entwurf und die Analyse von Algorithmen noch Datenbankverwaltungssysteme. Ich habe Matlab auch alleine gelernt, um Algorithmen in der Bachelorarbeit zu implementieren.
Der obige Hintergrund war während des Bachelor- und Masterstudiengangs. Jetzt, während der Promotion Ich entdeckte, dass maschinelles Lernen (für mich) die perfekte Mischung zwischen nichtlinearer Optimierung, Programmierung und Anwendungen in der realen Welt ist, dh es ist sowohl theoretisch interessant als auch anwendungsorientiert. Dies ist der Grund, warum ich so aufgeregt war, in die Industrie zu gehen. Daher habe ich in den letzten 3 Jahren angefangen, Dinge selbst zu lernen (in meiner kleinen Freizeit).
Kurze Zusammenfassung der gelernten Dinge:
Python: Ich bin damit vertraut, Optimierungsalgorithmen zu implementieren, mit Jupyter-Notizbüchern und der Numpy-Bibliothek zu arbeiten (tatsächlich musste ich dies für die Dissertation tun) und grundlegende Datenmanipulationen und Reinigungsaufgaben in Pandas durchzuführen. Dies habe ich online auf einer Plattform namens dataquest ( https://app.dataquest.io ) gelernt . Ich glaube jedoch nicht, dass ich genug Wissen habe, um ein Interview über Datenstrukturen und Algorithmen zu bestehen (siehe oben).
Maschinelles Lernen: Ich habe an der Uni einen Masterstudiengang zum Thema absolviert (da ich in Deutschland bin, haben wir keine Doktorandenkurse, das war alles in meiner persönlichen Zeit), was mir sehr gut gefallen hat. Themen enthalten: k-NN, PCA, SVM, NN usw.
In diesem Semester einen Kurs in Datenbanken belegen, der sich auf SQL konzentriert.
Nehmen Sie in diesem Semester die Spezialisierung Deep Learning auf Coursera.
Abschließend möchte ich sagen, dass ich mich in der Lage fühle, die Themen zu lernen. Tatsächlich beabsichtige ich mit der Zeit, mehr online verfügbare Kurse für Hochschulabsolventen zu belegen (z. B. Stanford CS231N, CS234 usw.), da Online-Kurse meiner Meinung nach möglicherweise nicht streng genug sind. Hoffentlich kann ich mich nach der Verteidigung ganz darauf konzentrieren.
Daher die Fragen:
Kann ich zu diesem Zeitpunkt noch eingestellt werden (ich meine, nach Abschluss dieses Semesters mit den oben beschriebenen Kenntnissen)? Ich denke ehrlich, ich bin nicht bereit, aber ich bin zuversichtlich, dass ich in einem Jahr anständig werden kann.
Bin ich zu naiv in dem Gedanken, dass ein Unternehmen mir eine Chance geben würde?
Was soll ich tun, um auf jeden Fall einstellbarer zu werden?
Antworten:
Ich bin mit den anderen Antworten nicht einverstanden, aber hier ist eine andere Perspektive, die Sie berücksichtigen sollten. Außerdem kann ich als jemand, der die Akademie (angewandte Mathematik / CS) für Datenwissenschaften verlassen hat, Antworten auf Ihre spezifischen Fragen geben.
Kurz gesagt, das Verständnis der zugrunde liegenden Anforderungen und Anwendungsfälle für ein Geschäftsproblem ist für jedes Projekt von größter Bedeutung. Daher ist die Entwicklung eines ausgeprägten Geschäftssinns und funktionsübergreifender Kommunikationsfähigkeiten von entscheidender Bedeutung, wenn Sie die größte Reichweite in einer Karriere als Datenwissenschaftler erzielen möchten.
Ich werde diese zusammen beantworten. Es hängt stark vom Unternehmen und seinen aktuellen Bedürfnissen ab. Für Sie kann dies in den Dimensionen "Startup" zu "Enterprise" und "ML Shop" zu "General Data Driven Business" variieren. Mit letzterem meine ich, dass es Unternehmen gibt, deren einziger Zweck darin besteht, ML-Produkte oder -Dienstleistungen an Kunden zu verkaufen, im Gegensatz zu allgemeinen Technologieunternehmen, die die Modellierung in ihrem Geschäft nutzen möchten. Möglicherweise finden Sie eine schnellere / einfachere Lösung für ein Unternehmen, dessen ML-Anwendungsfälle entweder bereits ausgebaut oder von anderen diktiert wurden, da Sie wahrscheinlich nicht in der Lage sind, den Beginn eines neuen Projekts strategisch zu planen.
Dies könnte also für ein größeres Unternehmen zutreffen, das eine Abteilung hat, die sich mit den technischen Details des ML-Modells befasst, während andere Teile des Unternehmens die Geschäftsstrategie und das Design bestimmen, oder für ein Unternehmen jeder Größe, das sich auf ML als Produkt konzentriert. Bedienung.
Kurzfristig können Sie wahrscheinlich jemanden davon überzeugen, Sie als Praktikanten oder Assistenten für einige Projekte zu haben, aber Ihre Promotion wird wahrscheinlich als potenzieller Nachteil angesehen, wenn Sie mit kleinen bis mittleren Unternehmen sprechen, die Generalisten einstellen möchten. Alleskönner ...
Was mich dazu bringt. Sie können Ihr eigenes Abenteuer wählen, da es so viele Arten von Rollen gibt. Sie sollten sich jedoch darüber im Klaren sein, nach welcher Art von Rolle und Situation jeder potenzielle Arbeitgeber sucht, und realistisch sein, wie Sie dazu passen könnten. Es gibt viele Arbeitgeber, die nicht klar ausdrücken, was sie wollen oder brauchen, oder selbst nicht wissen, was das ist . Sie sollten das gut mit ihnen herausfinden, um schwere Enttäuschungen zu vermeiden.
Wenn Sie Ihren Horizont in der Datenwissenschaft erweitern und sicherstellen möchten, dass Sie die höchsten geschäftlichen Auswirkungen und beruflichen Entwicklungsmöglichkeiten haben, möchten Sie viel mehr über Geschäftsanwendungen der Datenwissenschaft erfahren. Diese sind sehr unterschiedlich und sowohl informeller in der Praxis als auch für das Unternehmen insgesamt wirkungsvoller als die Sorge um Optimierungen für pseudo-invertierende Matrizen.
Trotz der vernünftigen Meinungen in den anderen veröffentlichten Antworten zum Markt gibt es meiner Meinung nach ein großes Marktdefizit für Datenwissenschaftler, die:
quelle
Data Science-Jobs decken eine breite Palette unterschiedlicher Aktivitäten ab, sodass jede Antwort wahrscheinlich subjektiv ist. Ich bin in der akademischen Welt, daher sind meine Kenntnisse des Arbeitsmarktes begrenzt, aber soweit ich sehen kann:
quelle
Erwan hat es geschafft (+1). Aber ich denke, mein Zusatz ist etwas zu lang für einen Kommentar.
Sie scheinen weit voraus zu sein, wo ich war, als ich meinen DS-Job bekam. Ich war in reiner Mathematik, ein paar Postdocs in und hatte nur eine kurze Zeit des Selbststudiums, als ich mich für die Datenwissenschaft der Industrie bewarb.
Auf der anderen Seite hatte ich versicherungsmathematische Prüfungen in meinem Undergrad, was mir wahrscheinlich geholfen hat, in den Fintech-Bereich einzusteigen. Betonen Sie bei der Bewerbung, was Sie bereits wissen, und geben Sie an, was Sie in den ersten Monaten lernen müssen (stärkere Programmierung? Mit Git? ...).
(Außerdem haben Sie in Ihrem ML-Kurs keine baumbasierten Modelle erwähnt: Ich denke, das war nur eine Auslassung, aber diese scheinen das wichtigste zu verstehende Modell zu sein, es sei denn, Sie versuchen, in Branchen mit neuronalen Netzen einzusteigen sind die Norm.)
quelle
Nehmen Sie diesen Rat einfach nicht blind an: Die Fächer, die Sie in der Mathematik erwähnt haben, sind für die Lösung von Problemen mit maschinellem Lernen / Deep Learning von zentraler Bedeutung. Die Programmierung ist ein Werkzeug, um all diese Theorie, die Sie lernen, umzusetzen. Auf dieser Grundlage erstellen Sie Ihre Hypothesen und dann Testen Sie, indem Sie es in Code implementieren, damit Sie keine Codierungsfähigkeiten eines Codierers benötigen. Sie sollten die Datenstrukturen Ihrer Verwendung kennen, insbesondere Datenrahmen und Tensormanipulation und Ruhe, die Sie während der Implementierung lernen werden. Das Beste an Ihnen ist, dass Sie über grundlegende mathematische Kenntnisse verfügen (ich gehe davon aus, dass Sie sich mit Wahrscheinlichkeitsstatistik, multivariater Analysis, Funktionsanalyse und den übrigen von Ihnen genannten Fächern auskennen. Ich werde nicht ins Detail gehen, da Sie bereits promovieren .
Ich würde vorschlagen, dass Sie alle Kurse von Fast.ai durchgehen, die von Jeremy Howard (er ist buchstäblich Gott des tiefen Lernens) unterrichtet werden. Sein Kurs über praktisches tiefes Lernen für Programmierer ist voller Wissen, abgesehen von dem für das grundlegende Verständnis der Mathematik hinter neuronalen Netzen Sie können einen Blog von Michael Nielsen mit dem Titel neuralnetworksanddeeplearning.com lesen. Es ist eigentlich ein Buch und ein großartiges, und Sie werden die mathematische Erklärung lieben. Zum besseren Verständnis können Sie immer in Chris olahs Blog lesen, es ist einfach großartig.
Jetzt können Sie also noch viele Forschungspraktika absolvieren und dort in einem industriellen Umfeld lernen, aber ich würde Ihnen eher empfehlen, sich etwas Zeit zu nehmen, diese Kurse durchzuarbeiten, die Angelegenheit in den Griff zu bekommen und die Mathematik hinter sich zu haben sind zu allem bereit. Sehen Sie, Data Science ist im Moment so, als ob jeder einer sein möchte und nur das 6-stellige Gehalt bekommt und fertig ist, aber es ist nicht so, dass Data Science nicht alles ist, was man auf einmal lernen kann, es braucht Zeit.
Nehmen Sie sich also etwas Zeit, seien Sie geduldig und lösen Sie weiter. Lesen Sie weiter Literatur zu den neuesten Themen, die jetzt frei verfügbar sind. Machen Sie also weiter.
quelle