Ich führe mit SPSS eine Entscheidungsbaumklassifizierung für einen Datensatz mit etwa 20 Prädiktoren durch (kategorial mit wenigen Kategorien). CHAID (Chi-squared Automatic Interaction Detection) und CRT / CART (Classification And Regression Trees) geben mir verschiedene Bäume. Kann jemand die relativen Vorzüge von CHAID vs CRT erklären? Was bedeutet es, eine Methode der anderen vorzuziehen?
23
Alle Einzelbaummethoden beinhalten eine erstaunliche Anzahl von Mehrfachvergleichen, die eine große Instabilität des Ergebnisses bewirken. Aus diesem Grund ist zur Erzielung einer zufriedenstellenden prädiktiven Diskriminierung eine Form der Baummittelwertbildung (Absacken, Boosten, zufällige Wälder) erforderlich (außer dass Sie den Vorteil der Bäume verlieren - Interpretierbarkeit). Die Einfachheit einzelner Bäume ist größtenteils eine Illusion. Sie sind einfach, weil sie in dem Sinne falsch sind, dass das Trainieren des Baums auf mehrere große Teilmengen der Daten große Meinungsverschiedenheiten zwischen Baumstrukturen aufdeckt.
Ich habe mir keine neuere CHAID-Methodik angesehen, aber CHAID in seiner ursprünglichen Inkarnation war eine großartige Übung bei der Überinterpretation von Daten.
quelle