Erstellen von MATLAB- und R-Schnittstellen zu Ross Quinlans C5.0

10

Ich erwäge den Aufbau MATLAB und R Schnittstellen zu Ross Quinlan ‚s C5.0 (für diejenigen , die nicht mit ihm vertraut, C5.0 ist ein Entscheidungsbaum - Algorithmus und Softwarepaket, eine Erweiterung von C4.5 ), und ich versuche , zu Machen Sie sich ein Bild von den Komponenten, die ich schreiben müsste.

Die einzige Dokumentation, die ich für C5.0 gefunden habe, ist hier. Dies ist ein Tutorial für See5 (eine Windows-Schnittstelle zu C5.0?). Die TAR- Datei enthält ein Makefile, jedoch keine Readme-Dateien oder zusätzliche Dokumentation.

Nach dem, was ich im obigen Tutorial gelesen habe, verwendet C5.0 eine ASCII-basierte Darstellung, um Ein- und Ausgänge zu verarbeiten, und ich denke auch darüber nach, eine Schnittstelle zu erstellen, die Binärdaten direkt zwischen MATLAB oder R und C5.0 überträgt. Wird die Datendarstellung von C5.0 von einer anderen Software für maschinelles Lernen / Klassifizierung verwendet?

Hat jemand schon einmal versucht, eine MATLAB- oder R-Schnittstelle für ID3, C4.5 oder C5.0 zu erstellen?

Vielen Dank

Amelio Vazquez-Reina
quelle
Geht dieses Projekt weiter? Ich habe versucht, das Paket C5.0 in R zu installieren, bin jedoch fehlgeschlagen.
Haben Sie jemals eine Implementierung von C5 für Matlab vorgenommen? Wenn Sie dies tun würden, wäre es äußerst nützlich. Ich bin gerade dabei, C5 mit Matlab zu verbinden, aber C5 scheint etwas chaotisch zu sein (kann nicht einfach Textdateien an und von Matlab übergeben, da es eine schwierige Formatierung verwendet).
dcm29

Antworten:

11

Das klingt nach einer großartigen Idee, zumal die Seite, auf die Sie verlinken, zeigt, dass C5.0 jetzt unter der GPL steht.

Ich habe einige Erfahrung darin, C / C ++ - Software mit Rcpp in R zu verpacken . Ich würde gerne helfen.

Dirk Eddelbuettel
quelle
1
Vielen Dank für das Angebot, zu helfen. Wir haben ein paar Studenten in unserem Labor, die sich vielleicht darum kümmern. Wir werden Sie wissen lassen, sobald wir die Dinge herausgefunden haben :)
Amelio Vazquez-Reina
5

Die Anbindung von C / C ++ - Code an MATLAB ist ziemlich einfach. Sie müssen lediglich eine MEX-Gateway-Funktion erstellen, um die Konvertierung von Parametern und Rückgabeparametern durchzuführen. Ich habe Erfahrung in der Erstellung von MEX-Dateien für diese Art von Dingen und würde gerne helfen.

Dikran Beuteltier
quelle
das klingt gut! Vielen Dank für Ihre Hilfsbereitschaft. Wir haben ein paar Studenten in unserem Labor, die sich möglicherweise an Sie wenden, wenn wir Hilfe benötigen.
Amelio Vazquez-Reina
4

AKTUALISIEREN:

Jetzt bei CRAN:

http://cran.r-project.org/web/packages/C50/index.html

ORIGINAL:

Wir haben jetzt ein bisschen daran gearbeitet (angefangen bei Cubist bis hin zu C5.0).

Wenn Sie einen Beitrag leisten möchten:

https://r-forge.r-project.org/projects/rulebasedmodels/

wurde vor kurzem erstellt und wir sollten den ursprünglichen Code einchecken.

Wir haben jetzt schon eine Weile Zugang zu den kubistischen Quellen (aber es gab eine ausdrückliche Vereinbarung, sie nicht mit anderen SW zu verknüpfen) und haben über die verschiedenen Optionen für die Einbindung des Codes diskutiert, aber ich denke

topepo
quelle