Ich verstehe theoretisch (sozusagen), wie sie funktionieren würden, bin mir aber nicht sicher, wie ich eine Ensemble-Methode anwenden soll (z. B. Abstimmung, gewichtete Mischungen usw.).
- Was sind gute Ressourcen für die Implementierung von Ensemble-Methoden?
- Gibt es spezielle Ressourcen für die Implementierung in Python?
BEARBEITEN:
Um einige anhand der Diskussion zu den Kommentaren zu klären, suche ich nicht nach Ensemble-Algorithmen wie randomForest usw. Stattdessen frage ich mich, wie Sie verschiedene Klassifikationen aus verschiedenen Algorithmen kombinieren können.
Angenommen, jemand verwendet logistische Regression, SVM und einige andere Methoden, um die Klasse einer bestimmten Beobachtung vorherzusagen. Was ist der beste Weg, um die beste Schätzung der Klasse basierend auf diesen Vorhersagen zu erfassen?
quelle
"Ensemble-Methoden im Data Mining: Verbessern der Genauigkeit durch Kombinieren von Vorhersagen", Seni und Elder - Hervorragende Referenz zur praktischen Ensemble-Theorie und -Implementierung, aber der zugehörige Code basiert auf R.
'Maschinelles Lernen: Eine algorithmische Perspektive', S. Marsland - Hervorragender Python-basierter praktischer Text, der jedoch nicht so reinen Ensemblekonzepten gewidmet ist wie die erste Referenz.
quelle
Die Reaktion des stumpfen Joe Pete war perfekt, aber da Sie von einer Python-Implementierung gesprochen haben, wollte ich das Brauprojekt der Universidade Federal de Pernambuco erwähnen .
https://github.com/viisar/brew
Zu diesem Zeitpunkt verfügen sie über Ensemblegenerierung, -kombination, -beschneidung und -dynamik.
Einschränkungen: nur Klassifizierung; kein Stapeln in der aktuellen öffentlichen Version; nicht viel dokumentation.
quelle
Salford Systems hat ein Softwarepaket namens Random Forests, das dies für Ensembles von Klassifizierungs- und Regressionsbäumen implementiert. Ich habe keine kostenlosen R-Pakete anzubieten. Ich stelle mir vor, sie haben ein Benutzerhandbuch, das ihre Implementierung erklärt. In Analogie könnten Sie wahrscheinlich herausfinden, wie dies für andere Ensemble-Methoden zu tun ist.
quelle
Ich fand dieses Tutorial sehr hilfreich. Es beantwortet nicht alle Beiträge, aber ich denke, es ist ein guter Anfang für die Diskussion: http://vikparuchuri.com/blog/intro-to-ensemble-learning-in-r/
quelle
Scikit-Learn- Ensembling-Guide bietet Bagging und Boosten von Meta-Klassifikatoren und Regressoren. Darüber hinaus bietet die mlxtend- Bibliothek Implementierungen zum Stapeln von Metaklassifikatoren und Regressoren.
quelle