Algorithmen für maschinelles Lernen zur Klassifizierung der Landbedeckung
37
Ich bin daran interessiert zu erfahren, welche Software für die Landklassifizierung mithilfe von Algorithmen für maschinelles Lernen (z. B. k-NN, Random Forest, Entscheidungsbäume usw.) vorhanden ist. Mir ist das randomForest- Paket in R und MILK und SPy in Python bekannt.
Welche Open-Source- oder kommerziellen Algorithmen für maschinelles Lernen eignen sich für die Klassifizierung der Landbedeckung?
Ich muss sagen, dass die umfassendste Softwareumgebung für maschinelles Lernen und nichtparametrische Modellierung R ist. Dies ist ein großes Feld in der Statistik, das K-NN, Kernel-Glättung, allgemeine additive Modelle, schwache Lernende, Unterstützungsvektoren, neuronale Netze und semi umfasst -parametrische Spline-Regression, Imputation usw. Ich kann die Lektüre von Hastie, T., R. Tibshirani und J. Friedman (2009) wärmstens empfehlen. Die Elemente des statistischen Lernens: Data Mining, Inferenz und Vorhersage. Springer-Reihe in der Statistik.
Neben R bietet die kommerzielle Software von Salford Systems Random Forests, Multivariate Adaptive Regression Splines, CART und Gradient Boosting (TreeNet) in einer GUI-Umgebung. RuleQuest verkauft weiterhin See5 / C5, eine aktualisierte Version des CART-Algorithmus C4 / ID3. Das Weka 3 der University of Waikato ist eine Open-Source-GUI / Commandline-Java-Version mit einer großen Anzahl verfügbarer Modelle.
@Aaron FYI, Falk Hutterman und ich unterrichten einen Workshop beim US-IALE (Landscape Ecology) 2013 Meeting in Austin, TX. Unser Fokus wird auf der Verwendung von R für maschinelles Lernen und nichtparametrische Modellierung liegen. Ich werde auch eine Einführung in die Verwendung von räumlichen Objekten in R zur Datenaufbereitung und Spezifikation von Modellen geben.
Das Projekt befindet sich in aktiver Entwicklung. Die letzte Version ist 0.12 und wurde im September veröffentlicht.
Informationen zu den Möglichkeiten des Pakets finden Sie unter Nächste Nachbarn , Zufällige Gesamtstruktur (unter Ensembe-Methoden) und Entscheidungsbäume , um die von Ihnen angegebenen Beispiele zu verwenden.
Leider keine grafische Benutzeroberfläche, es sei denn, Sie möchten sich mit der Erstellung einer beschäftigen, aber ich empfehle die iPython- IDE als hervorragende interaktive Skriptumgebung, einschließlich Inline-Plots mit matplotlib in der QT-Konsole.
Ein guter Überblick über die Techniken des maschinellen Lernens in R ist die Taskansicht des maschinellen Lernens . Es bietet eine Vielzahl verschiedener Algorithmen, die von Experten empfohlen werden.
Bei Ihrer Frage wird davon ausgegangen, dass sich Algorithmen für maschinelles Lernen für die Landklassifizierung irgendwie von Software unterscheiden, die für andere maschinelle Lernanwendungen verwendet wird. Es gibt einige Anwendungen, die aufgrund ungewöhnlicher Merkmale einer besonderen Behandlung bedürfen, aber ich kenne keinen Grund zu der Annahme, dass die Landnutzung einer besonderen Behandlung bedarf. Wenn Landnutzungsdaten in eine durch Kommas getrennte Standardform gebracht werden können, sollten vorhandene Tools wie R einwandfrei funktionieren. Jetzt gibt es vielleicht Landnutzungssoftware, die Modelle verwendet, die aus maschinellen Lerntechniken stammen, aber das ist eine andere Frage.
Nach der ersten Antwort bearbeitet. -> Die meisten der Hauptpakete für maschinelles Lernen enthalten einige Werkzeuge für die räumliche Visualisierung, obwohl sie möglicherweise nicht Ihren speziellen Anforderungen entsprechen. Kennen Sie zum Beispiel die sp-Bibliothek für R, die für die Visualisierung von Geodaten vorgesehen ist? Mal sehen, ob ich einen passenden Link finde, der zeigt, was Sie damit machen können.
Haben Sie sich eCognition angesehen? Mit ihrer neuen Version (8.9) bieten sie den Random Forests-Algorithmus in einer GUI-Umgebung. Sie können schöne Prozessbäume erstellen und Objektmerkmale einbeziehen.
Es gibt eine Gruppe von der Duke University, die einige interessante Skriptwerkzeuge für ArcGIS entwickelt hat, darunter zufällige Gesamtstrukturmodelle.
Die MGET-Toolbox ist nur ein Wrapper für R. Wenn Sie über die Fähigkeit verfügen, R zu verwenden, können Sie über Python (Rpy2) erhebliche Kopfschmerzen beim Aufrufen von R über ArcGIS vermeiden. Sie haben auch keine Flexibilität bei der Verwendung anderer Tools in R, die auf die resultierenden RF-, GAM-, Regressions- oder CART-Modellobjekte angewendet werden können.
Ich kann Scikits-learn für Python nur empfehlen . Es unterstützt beaufsichtigte und unbeaufsichtigte Klassifizierungen und die Dokumentation ist hervorragend (insbesondere das Tutorial Maschinelles Lernen für die Analyse astronomischer Daten und das dazugehörige YouTube-Video (Hinweis: Dies ist 3 Stunden lang)).
Das Projekt befindet sich in aktiver Entwicklung. Die letzte Version ist 0.12 und wurde im September veröffentlicht.
Informationen zu den Möglichkeiten des Pakets finden Sie unter Nächste Nachbarn , Zufällige Gesamtstruktur (unter Ensembe-Methoden) und Entscheidungsbäume , um die von Ihnen angegebenen Beispiele zu verwenden.
Leider keine grafische Benutzeroberfläche, es sei denn, Sie möchten sich mit der Erstellung einer beschäftigen, aber ich empfehle die iPython- IDE als hervorragende interaktive Skriptumgebung, einschließlich Inline-Plots mit matplotlib in der QT-Konsole.
quelle
Ein guter Überblick über die Techniken des maschinellen Lernens in R ist die Taskansicht des maschinellen Lernens . Es bietet eine Vielzahl verschiedener Algorithmen, die von Experten empfohlen werden.
quelle
Bei Ihrer Frage wird davon ausgegangen, dass sich Algorithmen für maschinelles Lernen für die Landklassifizierung irgendwie von Software unterscheiden, die für andere maschinelle Lernanwendungen verwendet wird. Es gibt einige Anwendungen, die aufgrund ungewöhnlicher Merkmale einer besonderen Behandlung bedürfen, aber ich kenne keinen Grund zu der Annahme, dass die Landnutzung einer besonderen Behandlung bedarf. Wenn Landnutzungsdaten in eine durch Kommas getrennte Standardform gebracht werden können, sollten vorhandene Tools wie R einwandfrei funktionieren. Jetzt gibt es vielleicht Landnutzungssoftware, die Modelle verwendet, die aus maschinellen Lerntechniken stammen, aber das ist eine andere Frage.
Nach der ersten Antwort bearbeitet. -> Die meisten der Hauptpakete für maschinelles Lernen enthalten einige Werkzeuge für die räumliche Visualisierung, obwohl sie möglicherweise nicht Ihren speziellen Anforderungen entsprechen. Kennen Sie zum Beispiel die sp-Bibliothek für R, die für die Visualisierung von Geodaten vorgesehen ist? Mal sehen, ob ich einen passenden Link finde, der zeigt, was Sie damit machen können.
http://rwiki.sciviews.org/doku.php?id=tips:spatial-data:spatial_data_visualization Eine ausführlichere Auflistung der für die räumliche Analyse in R nützlichen Tools finden Sie unter http: //cran.r- project.org/web/views/Spatial.html, da dies Werkzeuge für Geostatistik, ökologische Analyse und dergleichen umfasst.
quelle
Haben Sie sich eCognition angesehen? Mit ihrer neuen Version (8.9) bieten sie den Random Forests-Algorithmus in einer GUI-Umgebung. Sie können schöne Prozessbäume erstellen und Objektmerkmale einbeziehen.
quelle
Es gibt eine Gruppe von der Duke University, die einige interessante Skriptwerkzeuge für ArcGIS entwickelt hat, darunter zufällige Gesamtstrukturmodelle.
Marine Geospatial Ecology Tools
quelle
Sie können eine Landklassifizierung auch mit dem DTclassifier-Plugin (Decision Tree Classifier) für QGIS durchführen . Es bietet eine einfache Schnittstelle zur Klassifizierung von Rasterdaten mithilfe von Entscheidungsbäumen, die in QGIS ausgeführt werden können.
quelle