Ich bin erstaunt, dass ich keine Artikel / Vorträge darüber finden kann, wie man Prior Class Probability Distributions in Klassifikatoren wie Logistic Regression oder Random Forest integrieren kann.
Meine Frage lautet also:
Wie kann die Wahrscheinlichkeitsverteilung früherer Klassen in logistische Regression oder zufällige Wälder einbezogen werden?
Bedeutet die Einbeziehung der Wahrscheinlichkeitsverteilung früherer Klassen, dass ich Bayes'sche Maschinen verwenden sollte?
Ich stehe vor einer Klassifizierungsaufgabe, bei der ich weiß, dass Klasse a viel wahrscheinlicher ist als Klasse b.
Eine Ad-hoc-Lösung wäre, einfach mehr Proben für Klasse A in das Trainingsset aufzunehmen. Gibt es hierzu theoretische Ergebnisse?
Eine Sache, über die ich nachdachte, war, die Entscheidungsschwelle von 0,5 auf einen Wert zu ändern, der dieses vorherige Ungleichgewicht berücksichtigt. Ich bin mir jedoch nicht einmal sicher, ob dies theoretisch sinnvoll ist, da ich an dem Punkt, an dem ich bereit bin, eine Entscheidung zu treffen, bereits alle Merkmalswerte betrachtet habe, sodass ich mich nicht um die vorherige Wahrscheinlichkeit, sondern um die klassenbedingte Wahrscheinlichkeit kümmern sollte.
quelle