Math PhD (Nonlinear Programming) wechselt zu Data Science?

9

Ich bin ein Mathe-Ph.D. Student, der daran interessiert ist, nach seinem Abschluss als Data Scientist in die Branche zu gehen. Ich werde kurz einige Hintergrundinformationen zu meiner Ausbildung geben, bevor ich meine Frage stelle, damit sie besser verstanden wird:

Mathe-Kursarbeit:

Dies geschah hauptsächlich in reiner Mathematik: Topologie, Funktionsanalyse usw., aber auch in angewandteren (auf die ich mich auf die Dissertation spezialisiert habe): konvexe Optimierung, nichtlineare Programmierung, numerische Analyse, lineare Programmierung, multiobjektive Optimierung. Außerdem habe ich momentan keine Kenntnisse über Inferenzstatistiken, bin aber zuversichtlich in die Wahrscheinlichkeitstheorie.

Programmierung:

Ich habe gerade einen einjährigen Kurs im Bachelor belegt, aber es waren hauptsächlich Mathematica und etwas Java, an das ich mich ehrlich gesagt nicht erinnere. In diesem Kurs enthielt der Inhalt weder Datenstrukturen noch den Entwurf und die Analyse von Algorithmen noch Datenbankverwaltungssysteme. Ich habe Matlab auch alleine gelernt, um Algorithmen in der Bachelorarbeit zu implementieren.

Der obige Hintergrund war während des Bachelor- und Masterstudiengangs. Jetzt, während der Promotion Ich entdeckte, dass maschinelles Lernen (für mich) die perfekte Mischung zwischen nichtlinearer Optimierung, Programmierung und Anwendungen in der realen Welt ist, dh es ist sowohl theoretisch interessant als auch anwendungsorientiert. Dies ist der Grund, warum ich so aufgeregt war, in die Industrie zu gehen. Daher habe ich in den letzten 3 Jahren angefangen, Dinge selbst zu lernen (in meiner kleinen Freizeit).

Kurze Zusammenfassung der gelernten Dinge:

  • Python: Ich bin damit vertraut, Optimierungsalgorithmen zu implementieren, mit Jupyter-Notizbüchern und der Numpy-Bibliothek zu arbeiten (tatsächlich musste ich dies für die Dissertation tun) und grundlegende Datenmanipulationen und Reinigungsaufgaben in Pandas durchzuführen. Dies habe ich online auf einer Plattform namens dataquest ( https://app.dataquest.io ) gelernt . Ich glaube jedoch nicht, dass ich genug Wissen habe, um ein Interview über Datenstrukturen und Algorithmen zu bestehen (siehe oben).

  • Maschinelles Lernen: Ich habe an der Uni einen Masterstudiengang zum Thema absolviert (da ich in Deutschland bin, haben wir keine Doktorandenkurse, das war alles in meiner persönlichen Zeit), was mir sehr gut gefallen hat. Themen enthalten: k-NN, PCA, SVM, NN usw.

  • In diesem Semester einen Kurs in Datenbanken belegen, der sich auf SQL konzentriert.

  • Nehmen Sie in diesem Semester die Spezialisierung Deep Learning auf Coursera.

Abschließend möchte ich sagen, dass ich mich in der Lage fühle, die Themen zu lernen. Tatsächlich beabsichtige ich mit der Zeit, mehr online verfügbare Kurse für Hochschulabsolventen zu belegen (z. B. Stanford CS231N, CS234 usw.), da Online-Kurse meiner Meinung nach möglicherweise nicht streng genug sind. Hoffentlich kann ich mich nach der Verteidigung ganz darauf konzentrieren.

Daher die Fragen:

  • Kann ich zu diesem Zeitpunkt noch eingestellt werden (ich meine, nach Abschluss dieses Semesters mit den oben beschriebenen Kenntnissen)? Ich denke ehrlich, ich bin nicht bereit, aber ich bin zuversichtlich, dass ich in einem Jahr anständig werden kann.

  • Bin ich zu naiv in dem Gedanken, dass ein Unternehmen mir eine Chance geben würde?

  • Was soll ich tun, um auf jeden Fall einstellbarer zu werden?

John D.
quelle
1
Als ich mich für meinen Job bewarb (in Deutschland), gab es mindestens zwei Unternehmen, die nur die mathematischen Kenntnisse berücksichtigten. Sie kümmerten sich um nichts anderes. Programmieren wäre ein Gefallen, aber sie haben engagierte Programmierer, um die Dinge, an denen hauptsächlich Mathematiker und Physiker arbeiten, in Software umzuwandeln.
Ben

Antworten:

4

Ich bin mit den anderen Antworten nicht einverstanden, aber hier ist eine andere Perspektive, die Sie berücksichtigen sollten. Außerdem kann ich als jemand, der die Akademie (angewandte Mathematik / CS) für Datenwissenschaften verlassen hat, Antworten auf Ihre spezifischen Fragen geben.

Kurz gesagt, das Verständnis der zugrunde liegenden Anforderungen und Anwendungsfälle für ein Geschäftsproblem ist für jedes Projekt von größter Bedeutung. Daher ist die Entwicklung eines ausgeprägten Geschäftssinns und funktionsübergreifender Kommunikationsfähigkeiten von entscheidender Bedeutung, wenn Sie die größte Reichweite in einer Karriere als Datenwissenschaftler erzielen möchten.

  • Kann ich zu diesem Zeitpunkt noch eingestellt werden (ich meine, nach Abschluss dieses Semesters mit den oben beschriebenen Kenntnissen)? Ich denke ehrlich, ich bin nicht bereit, aber ich bin zuversichtlich, dass ich in einem Jahr anständig werden kann.
  • Bin ich zu naiv in dem Gedanken, dass ein Unternehmen mir eine Chance geben würde?

Ich werde diese zusammen beantworten. Es hängt stark vom Unternehmen und seinen aktuellen Bedürfnissen ab. Für Sie kann dies in den Dimensionen "Startup" zu "Enterprise" und "ML Shop" zu "General Data Driven Business" variieren. Mit letzterem meine ich, dass es Unternehmen gibt, deren einziger Zweck darin besteht, ML-Produkte oder -Dienstleistungen an Kunden zu verkaufen, im Gegensatz zu allgemeinen Technologieunternehmen, die die Modellierung in ihrem Geschäft nutzen möchten. Möglicherweise finden Sie eine schnellere / einfachere Lösung für ein Unternehmen, dessen ML-Anwendungsfälle entweder bereits ausgebaut oder von anderen diktiert wurden, da Sie wahrscheinlich nicht in der Lage sind, den Beginn eines neuen Projekts strategisch zu planen.

Dies könnte also für ein größeres Unternehmen zutreffen, das eine Abteilung hat, die sich mit den technischen Details des ML-Modells befasst, während andere Teile des Unternehmens die Geschäftsstrategie und das Design bestimmen, oder für ein Unternehmen jeder Größe, das sich auf ML als Produkt konzentriert. Bedienung.

Kurzfristig können Sie wahrscheinlich jemanden davon überzeugen, Sie als Praktikanten oder Assistenten für einige Projekte zu haben, aber Ihre Promotion wird wahrscheinlich als potenzieller Nachteil angesehen, wenn Sie mit kleinen bis mittleren Unternehmen sprechen, die Generalisten einstellen möchten. Alleskönner ...

  • Was soll ich tun, um auf jeden Fall einstellbarer zu werden?

Was mich dazu bringt. Sie können Ihr eigenes Abenteuer wählen, da es so viele Arten von Rollen gibt. Sie sollten sich jedoch darüber im Klaren sein, nach welcher Art von Rolle und Situation jeder potenzielle Arbeitgeber sucht, und realistisch sein, wie Sie dazu passen könnten. Es gibt viele Arbeitgeber, die nicht klar ausdrücken, was sie wollen oder brauchen, oder selbst nicht wissen, was das ist . Sie sollten das gut mit ihnen herausfinden, um schwere Enttäuschungen zu vermeiden.

Wenn Sie Ihren Horizont in der Datenwissenschaft erweitern und sicherstellen möchten, dass Sie die höchsten geschäftlichen Auswirkungen und beruflichen Entwicklungsmöglichkeiten haben, möchten Sie viel mehr über Geschäftsanwendungen der Datenwissenschaft erfahren. Diese sind sehr unterschiedlich und sowohl informeller in der Praxis als auch für das Unternehmen insgesamt wirkungsvoller als die Sorge um Optimierungen für pseudo-invertierende Matrizen.

Trotz der vernünftigen Meinungen in den anderen veröffentlichten Antworten zum Markt gibt es meiner Meinung nach ein großes Marktdefizit für Datenwissenschaftler, die:

  • Verstehen Sie die Geschäftsanforderungen wirklich und können Sie effektiv mit nicht-technischen Personen kommunizieren
  • Entwickeln und Ausführen von Plänen, die eine allgemeine datengesteuerte Problemlösung beinhalten, die das Erstellen "cooler" Modelle beinhalten kann oder nicht (und ehrlich gesagt wahrscheinlich nicht, zumindest nicht, bis das Problem durch traditionellere Erkundungsmethoden sehr gut verstanden wird).
RHC
quelle
sehr schöne Antwort
pcko1
Ich (neuer MSc Math Grad) glaube, dass ich im gegenüberliegenden Boot als OP bin. Ein bisschen Programmieren dort, ein bisschen Mathe hier, aber nirgendwo zu tief. Meine Ausbildung ist zu allgemein, daher ist es schwer, sich abzuheben. Ich habe reichlich Soft Skills, wie Sie in Ihrer vorletzten Kugel erwähnt haben. Sobald ich ein technisches Konzept vollständig verstanden habe, kann ich es den Laien recht gut erklären. Ich war auch Offizier in der Marine, daher habe ich viel Erfahrung in der Arbeit mit Menschen und in der Projektion eines "Bildes", das meiner Meinung nach in eine geschäftliche Denkweise übergeht.
rocksNwaves
10

Data Science-Jobs decken eine breite Palette unterschiedlicher Aktivitäten ab, sodass jede Antwort wahrscheinlich subjektiv ist. Ich bin in der akademischen Welt, daher sind meine Kenntnisse des Arbeitsmarktes begrenzt, aber soweit ich sehen kann:

  • Der aktuelle Kontext ist für Datenwissenschaftler, die einen Job suchen, sehr günstig, sodass jeder mit Grundkenntnissen in ML eine Chance hat. Du bist schon über diesem Level, also keine Sorge an dieser Front imho. Der Trend wird sich wahrscheinlich so fortsetzen, aber niemand kennt die Zukunft.
  • Um Ihre Chancen zu erhöhen, sollten Sie im Idealfall nachweisen können, dass Sie einige praktische Erfahrungen haben: zum Beispiel Github-Projekte, Teilnahme an einem ML-Wettbewerb, so etwas.
  • Vernachlässigen Sie nicht Ihre Mathematik-Promotion: Sie scheinen viel Freizeit zu haben, um Data Science zu lernen, gut für Sie ... Aber stellen Sie sicher, dass die Promotion Ihre oberste Priorität ist. Sie wird ein großer Vorteil für Ihren Lebenslauf sein, auch wenn Es hat nichts mit Data Science zu tun.
Erwan
quelle
Danke für die Antwort!
John D
3

Erwan hat es geschafft (+1). Aber ich denke, mein Zusatz ist etwas zu lang für einen Kommentar.

Sie scheinen weit voraus zu sein, wo ich war, als ich meinen DS-Job bekam. Ich war in reiner Mathematik, ein paar Postdocs in und hatte nur eine kurze Zeit des Selbststudiums, als ich mich für die Datenwissenschaft der Industrie bewarb.

Auf der anderen Seite hatte ich versicherungsmathematische Prüfungen in meinem Undergrad, was mir wahrscheinlich geholfen hat, in den Fintech-Bereich einzusteigen. Betonen Sie bei der Bewerbung, was Sie bereits wissen, und geben Sie an, was Sie in den ersten Monaten lernen müssen (stärkere Programmierung? Mit Git? ...).

(Außerdem haben Sie in Ihrem ML-Kurs keine baumbasierten Modelle erwähnt: Ich denke, das war nur eine Auslassung, aber diese scheinen das wichtigste zu verstehende Modell zu sein, es sei denn, Sie versuchen, in Branchen mit neuronalen Netzen einzusteigen sind die Norm.)

Ben Reiniger
quelle
Danke für die Antwort! Gut zu wissen, dass es nicht das erste Mal ist, dass ein reiner Mathematiker in die Datenwissenschaft geht.
John D
Darf ich fragen, wie Sie zu Online-Kursen wie der Deep Learning-Spezialisierung auf Coursera stehen? Bereitet Sie diese Art von Kursen wirklich auf die Arbeit in der Branche vor?
John D
Anstatt bei Coresera zu versuchen, versuchen Sie es mit fast.ai-Kursen, die eher auf reale Anwendungen zugeschnitten sind. Coursera ist gut, wenn Sie einen Kurs in einem MOOC sehen, in dem Sie Themen, Themen und Konzepte lernen. Danach liegt es an Ihnen, wie viel Sie tun Verwenden Sie diese erlernten Tools für Ihre erforderlichen Anwendungen. Überdenken Sie es einfach nicht, steigen Sie einfach ein und ich versichere Ihnen, dass Sie Ihre Leidenschaft finden werden.
Khwaja Wisal
3

Nehmen Sie diesen Rat einfach nicht blind an: Die Fächer, die Sie in der Mathematik erwähnt haben, sind für die Lösung von Problemen mit maschinellem Lernen / Deep Learning von zentraler Bedeutung. Die Programmierung ist ein Werkzeug, um all diese Theorie, die Sie lernen, umzusetzen. Auf dieser Grundlage erstellen Sie Ihre Hypothesen und dann Testen Sie, indem Sie es in Code implementieren, damit Sie keine Codierungsfähigkeiten eines Codierers benötigen. Sie sollten die Datenstrukturen Ihrer Verwendung kennen, insbesondere Datenrahmen und Tensormanipulation und Ruhe, die Sie während der Implementierung lernen werden. Das Beste an Ihnen ist, dass Sie über grundlegende mathematische Kenntnisse verfügen (ich gehe davon aus, dass Sie sich mit Wahrscheinlichkeitsstatistik, multivariater Analysis, Funktionsanalyse und den übrigen von Ihnen genannten Fächern auskennen. Ich werde nicht ins Detail gehen, da Sie bereits promovieren .

Ich würde vorschlagen, dass Sie alle Kurse von Fast.ai durchgehen, die von Jeremy Howard (er ist buchstäblich Gott des tiefen Lernens) unterrichtet werden. Sein Kurs über praktisches tiefes Lernen für Programmierer ist voller Wissen, abgesehen von dem für das grundlegende Verständnis der Mathematik hinter neuronalen Netzen Sie können einen Blog von Michael Nielsen mit dem Titel neuralnetworksanddeeplearning.com lesen. Es ist eigentlich ein Buch und ein großartiges, und Sie werden die mathematische Erklärung lieben. Zum besseren Verständnis können Sie immer in Chris olahs Blog lesen, es ist einfach großartig.

Jetzt können Sie also noch viele Forschungspraktika absolvieren und dort in einem industriellen Umfeld lernen, aber ich würde Ihnen eher empfehlen, sich etwas Zeit zu nehmen, diese Kurse durchzuarbeiten, die Angelegenheit in den Griff zu bekommen und die Mathematik hinter sich zu haben sind zu allem bereit. Sehen Sie, Data Science ist im Moment so, als ob jeder einer sein möchte und nur das 6-stellige Gehalt bekommt und fertig ist, aber es ist nicht so, dass Data Science nicht alles ist, was man auf einmal lernen kann, es braucht Zeit.

Nehmen Sie sich also etwas Zeit, seien Sie geduldig und lösen Sie weiter. Lesen Sie weiter Literatur zu den neuesten Themen, die jetzt frei verfügbar sind. Machen Sie also weiter.

khwaja wisal
quelle
Danke für die Antwort! Wird besorgt.
John D