Letzte Bearbeitung mit allen Ressourcen aktualisiert:
Für ein Projekt wende ich Algorithmen für maschinelles Lernen zur Klassifizierung an.
Herausforderung: Sehr begrenzte beschriftete Daten und viel mehr unbeschriftete Daten.
Tore:
- Wenden Sie eine halbüberwachte Klassifizierung an
- Wenden Sie einen halbüberwachten Etikettierungsprozess an (bekannt als aktives Lernen).
Ich habe viele Informationen aus Forschungsarbeiten gefunden, wie zum Beispiel die Anwendung von EM, Transductive SVM oder S3VM (Semi Supervised SVM) oder die Verwendung von LDA usw. Auch zu diesem Thema gibt es nur wenige Bücher.
Frage: Wo sind die Implementierungen und praktischen Quellen?
Letztes Update (basierend auf den Hilfen von mpiktas, bayer und Dikran Marsupial)
Teilüberwachtes Lernen:
- TSVM: in SVMligth und SVMlin .
- EM Naive Bayes in Python
- EM im LinePipe-Projekt
Aktives Lernen:
- Dualist : eine Implementierung des aktiven Lernens mit Quellcode zur Textklassifizierung
- Diese Webseite bietet einen wunderbaren Überblick über aktives Lernen.
- Ein experimenteller Design Workshop: hier .
Tiefes Lernen:
- Einführungsvideo hier .
- Allgemeine Website .
- Stanford Unbeaufsichtigtes Lern- und Deep-Learning- Tutorial .
Antworten:
Es scheint, als ob Deep Learning für Sie sehr interessant sein könnte. Dies ist ein sehr junges Gebiet von Deep-Connection-Modellen, die unbeaufsichtigt trainiert und anschließend unter Aufsicht verfeinert werden. Die Feinabstimmung erfordert viel weniger Proben als das Vor-Trainieren.
Ich empfehle [Semantig Hashing Salakhutdinov, Hinton . Schauen Sie sich die Codes an, die darin enthalten sind, um eindeutige Dokumente des Reuters-Korpus zu finden: (unbeaufsichtigt!)
Wenn Sie Code benötigen, lesen Sie deeplearning.net . Ich glaube jedoch nicht, dass es Out-of-the-Box-Lösungen gibt.
quelle
Isabelle Guyon (und Kollegen) organisierten vor einiger Zeit eine Herausforderung zum aktiven Lernen, die Berichte werden hier veröffentlicht (Open Access). Dies hat den Vorteil, dass es sehr praktisch ist und dass Sie die Leistungen verschiedener Ansätze unter einem unvoreingenommenen (umgangssprachlichen) Protokoll direkt vergleichen können (die zufällige Auswahl von Mustern ist überraschend schwer zu übertreffen).
quelle
Hier ist eine schöne Liste von Bibliotheken.
http://www.infoworld.com/article/2608742/predictive-analytics/5-ways-to-add-machine-learning-to-java--javascript--and-more.html
quelle