Data Science

37
Verwenden Datenwissenschaftler Excel?

Ich würde mich als Gesellen-Datenwissenschaftler bezeichnen. Wie die meisten (glaube ich) habe ich meine ersten Diagramme erstellt und meine ersten Aggregationen in der Schule und am College mit Excel durchgeführt. Als ich das College, die Graduiertenschule und ~ 7 Jahre Berufserfahrung hinter mir...

37
Wie ist die Ausgabe von XGBoost zu interpretieren?

Ich habe ein xgboost-Modell ausgeführt. Ich weiß nicht genau, wie ich die Ausgabe von interpretieren soll xgb.importance. Was ist die Bedeutung von Gain, Cover und Frequency und wie interpretieren wir sie? Was bedeuten Split, RealCover und RealCover%? Ich habe einige zusätzliche Parameter hier Gibt...

35
Erklärung der entropieübergreifenden Verluste

Angenommen, ich erstelle eine NN für die Klassifizierung. Die letzte Schicht ist eine dichte Schicht mit Softmax-Aktivierung. Ich habe fünf verschiedene Klassen zu klassifizieren. Angenommen, für ein einzelnes Trainingsbeispiel true labelist das, [1 0 0 0 0]während die Vorhersagen sind [0.1 0.5 0.1...

35
Was halten Sie von Data Science-Zertifizierungen?

Ich habe jetzt zwei Data Science-Zertifizierungsprogramme gesehen - das John Hopkins- Programm, das bei Coursera erhältlich ist, und das Cloudera- Programm . Ich bin sicher, es gibt andere da draußen. Die John Hopkins-Gruppe von Klassen konzentriert sich auf R als Toolset, deckt jedoch eine Reihe...

34
Organisierte Prozesse zur Datenbereinigung

Durch meine eingeschränkte Beschäftigung mit Data Science mit R wurde mir klar, dass die Bereinigung fehlerhafter Daten ein sehr wichtiger Teil der Vorbereitung von Daten für die Analyse ist. Gibt es Best Practices oder Verfahren zum Bereinigen von Daten vor deren Verarbeitung? Wenn ja, gibt es...

33
Öffnen einer 20-GB-Datei zur Analyse mit Pandas

Ich versuche gerade, eine Datei mit Pandas und Python für maschinelles Lernen zu öffnen. Es wäre ideal, wenn ich sie alle in einem DataFrame hätte. Jetzt ist die Datei 18 GB groß und mein RAM ist 32 GB, aber ich bekomme immer wieder Speicherfehler. Aus Ihrer Erfahrung ist es möglich? Wenn nicht,...

33
Multi GPU in Keras

Wie können Sie in der Keras-Bibliothek (oder im Tensorflow) programmieren, um das Training auf mehrere GPUs aufzuteilen? Angenommen, Sie befinden sich in einer Amazon ec2-Instanz mit 8 GPUs und möchten alle verwenden, um schneller zu trainieren. Ihr Code ist jedoch nur für eine einzelne CPU oder...