Logbuch: Ansätze des maschinellen Lernens

7

Wenn ich in der Vergangenheit verschiedene Algorithmen für maschinelles Lernen ausprobiert habe, um ein Problem zu lösen, habe ich die Ansätze auf ein Notizbuch geschrieben und dabei Details wie Funktionen, Vorverarbeitung von Funktionen, Normalisierung, Algorithmen, Algorithmusparameter usw. beibehalten. ein handgeschriebenes Logbuch erstellen.

Derzeit bin ich jedoch besorgt darüber, ein "professionelleres" Tool zu verwenden, damit ich mehr Details behalten und es sogar mit anderen Teammitgliedern teilen kann, die ebenfalls in der Lage sind, ihre Ansätze zu prägen.

Es wäre ein großartiges automatisiertes und kollaboratives Tool, das die geleistete Arbeit verfolgt und Details wie Funktionen, Algorithmen, Algorithmusparameter, Datenvorverarbeitung, Daten, Metriken ... berücksichtigt, die beispielsweise über eine kollaborative Google Drive-Tabelle hinausgehen.

Wie lösen Sie das? Wie verfolgen Sie die geleistete Arbeit? Was ist Ihr Logbuch- Tool?

Vielen Dank im Voraus.

Jorge
quelle

Antworten:

4

Wie lösen Sie das? Wie verfolgen Sie die geleistete Arbeit? Was ist Ihr Logbuch-Tool?

Dies ist möglicherweise nicht der beste Ansatz. Aber so macht es mein Team. Wir glauben, dass für das Durchführen eines durchgängigen datenwissenschaftlichen Experiments ein gutes Gewissen sehr wichtig ist. Deshalb verwenden wir Slack für unsere Diskussionen und Meetings.

Zusätzlich haben wir Rmd-Dateien (R-Markdown) zur Dokumentation der Planungs- und Analyseteile.

Dawny33
quelle
1
Ich mag die Idee, Markdown zu verwenden, aber ich denke, es ist nicht der beste Ansatz / die beste Lösung. Es ist gut für einen Anfangspunkt. Ich benutze auch Slack und empfehle es sehr für die Koordination und Besprechungen von Teams.
Jorge
@Jorge Ja, ich stimme zu, dass dies nicht der beste Ansatz ist :) Ich habe jedoch keine gute Alternative gefunden, für die es sich zu investieren lohnt!
Dawny33
3

Schauen Sie sich das an, es sieht genau so aus, wie Sie es brauchen http://www.openml.org

Diego
quelle
Ist das ein Google-Produkt? Die Benutzeroberfläche sieht sehr google-artig aus
Dawny33
1
Ich weiß es nicht. Ich bin in keiner Weise mit dieser Site verbunden. Sie haben ihre Besitzer und Hoster Informationen auf der Titelseite aufgeführt.
Diego
2

Wie lösen Sie das? Wie verfolgen Sie die geleistete Arbeit? Was ist Ihr Logbuch-Tool?

Für meine Bachelorarbeit ( write-math.com ) habe ich mein eigenes kleines Toolkit geschrieben, um sehr schnell verschiedene Modelle / Vorverarbeitungsschritte durchzugehen . Jedes Experiment hatte eine Konfigurationsdatei (siehe Repository für hwr-Experimente ). Zum Beispiel:

data-source: feature-files/baseline-3-points
training: '{{nntoolkit}} train --epochs 1000 --learning-rate 0.1 --momentum 0.1 --print-errors --hook=''!detl
    test {{testing}},err=testresult_%e.txt'' {{training}} {{validation}}
    {{testing}} < {{src_model}} > {{target_model}} 2>> {{target_model}}.log'
model:
    type: mlp
    topology: 24:500:369

Das trainierte Modell wird gespeichert; Es ist ziemlich schnell, die Bewertungsergebnisse zu erhalten (z. B. Genauigkeit, Konfusionsmatrix).

Martin Thoma
quelle