Ich erwäge den Aufbau MATLAB und R Schnittstellen zu Ross Quinlan ‚s C5.0 (für diejenigen , die nicht mit ihm vertraut, C5.0 ist ein Entscheidungsbaum - Algorithmus und Softwarepaket, eine Erweiterung von C4.5 ), und ich versuche , zu Machen Sie sich ein Bild von den Komponenten, die ich schreiben müsste.
Die einzige Dokumentation, die ich für C5.0 gefunden habe, ist hier. Dies ist ein Tutorial für See5 (eine Windows-Schnittstelle zu C5.0?). Die TAR- Datei enthält ein Makefile, jedoch keine Readme-Dateien oder zusätzliche Dokumentation.
Nach dem, was ich im obigen Tutorial gelesen habe, verwendet C5.0 eine ASCII-basierte Darstellung, um Ein- und Ausgänge zu verarbeiten, und ich denke auch darüber nach, eine Schnittstelle zu erstellen, die Binärdaten direkt zwischen MATLAB oder R und C5.0 überträgt. Wird die Datendarstellung von C5.0 von einer anderen Software für maschinelles Lernen / Klassifizierung verwendet?
Hat jemand schon einmal versucht, eine MATLAB- oder R-Schnittstelle für ID3, C4.5 oder C5.0 zu erstellen?
Vielen Dank
quelle
Antworten:
Das klingt nach einer großartigen Idee, zumal die Seite, auf die Sie verlinken, zeigt, dass C5.0 jetzt unter der GPL steht.
Ich habe einige Erfahrung darin, C / C ++ - Software mit Rcpp in R zu verpacken . Ich würde gerne helfen.
quelle
Die Anbindung von C / C ++ - Code an MATLAB ist ziemlich einfach. Sie müssen lediglich eine MEX-Gateway-Funktion erstellen, um die Konvertierung von Parametern und Rückgabeparametern durchzuführen. Ich habe Erfahrung in der Erstellung von MEX-Dateien für diese Art von Dingen und würde gerne helfen.
quelle
AKTUALISIEREN:
Jetzt bei CRAN:
http://cran.r-project.org/web/packages/C50/index.html
ORIGINAL:
Wir haben jetzt ein bisschen daran gearbeitet (angefangen bei Cubist bis hin zu C5.0).
Wenn Sie einen Beitrag leisten möchten:
https://r-forge.r-project.org/projects/rulebasedmodels/
wurde vor kurzem erstellt und wir sollten den ursprünglichen Code einchecken.
Wir haben jetzt schon eine Weile Zugang zu den kubistischen Quellen (aber es gab eine ausdrückliche Vereinbarung, sie nicht mit anderen SW zu verknüpfen) und haben über die verschiedenen Optionen für die Einbindung des Codes diskutiert, aber ich denke
quelle
Die Dokumentation zu C5.0 (Linux) finden Sie unter http://rulequest.com/see5-unix.html
quelle