Fast jedes Entscheidungsbaum-Beispiel, auf das ich gestoßen bin, ist zufällig ein Binärbaum. Ist das so ziemlich universell? Unterstützen die meisten Standardalgorithmen (C4.5, CART usw.) nur binäre Bäume? Soweit ich weiß, ist CHAID nicht auf binäre Bäume beschränkt, aber das scheint eine Ausnahme zu sein.
Eine Zwei-Wege-Trennung, gefolgt von einer weiteren Zwei-Wege-Trennung bei einem der Kinder, ist nicht dasselbe wie eine einzelne Drei-Wege-Trennung. Dies mag ein akademischer Punkt sein, aber ich versuche sicherzustellen, dass ich die häufigsten Anwendungsfälle verstehe.
quelle
Ich bin mir nicht sicher, was du hier meinst. Jede Mehrwege-Aufteilung kann als eine Reihe von Zweiwege-Aufteilungen dargestellt werden. Bei einer Dreifachaufteilung können Sie in A, B und C aufteilen, indem Sie zuerst in A & B und dann in C aufteilen und dann A von B trennen.
Ein gegebener Algorithmus wählt möglicherweise nicht diese bestimmte Sequenz aus (insbesondere, wenn er, wie die meisten Algorithmen, gierig ist), aber dies könnte durchaus der Fall sein. Und wenn zufällige oder stufenweise Abläufe wie in zufälligen Wäldern oder aufgestockten Bäumen durchgeführt werden, steigt die Wahrscheinlichkeit, die richtige Abfolge von Teilungen zu finden. Wie andere bereits ausgeführt haben, sind Mehrwegeteilungen rechenintensiv. Angesichts dieser Alternativen scheinen sich die meisten Forscher für binäre Teilungen entschieden zu haben.
Hoffe das hilft
quelle
In Bezug auf die Verwendung des Entscheidungsbaums und der Aufteilung (binär im Vergleich zu anderen) kenne ich nur CHAID mit nicht-binären Aufteilungen, aber es gibt wahrscheinlich auch andere. Für mich ist die Hauptanwendung einer nicht-binären Aufteilung das Data-Mining, bei dem es darum geht, eine nominelle Variable mit vielen Ebenen optimal zu bündeln. Eine Reihe von binären Teilungen ist nicht so nützlich wie eine von CHAID durchgeführte Gruppierung.
quelle
Bitte lesen Sie dies
quelle