Wann sollte Bayesian Networks gegenüber anderen Ansätzen des maschinellen Lernens eingesetzt werden?

12

Ich gehe davon aus, dass es keine endgültige Antwort auf diese Frage gibt. Aber ich habe in der Vergangenheit eine Reihe von Algorithmen für maschinelles Lernen verwendet und versuche, etwas über Bayes'sche Netzwerke zu lernen. Ich würde gerne verstehen, unter welchen Umständen oder bei welchen Arten von Problemen Sie Bayesian Network gegenüber anderen Ansätzen einsetzen würden.

AndyC
quelle
3
Bayesian Networks sind für mich eine Möglichkeit, die bedingten Abhängigkeiten in einem Modell zu definieren. Nachdem Sie dies definiert haben, können Sie vermutlich verschiedene Lernwerkzeuge verwenden, um die Modellparameter abzuschätzen. Ich sehe also eine klare Trennung zwischen dem Parameterlernen und dem Modell. Ich bin jedoch kein Experte in diesem Bereich, sodass jemand eine bessere Antwort finden kann.
Luca

Antworten:

7

XY.P(X,Y.)P(Y.|X)

P(X1|Y.)P(X1|X2=EIN,X3=B)P(Y.|X)

BNs verwenden DAGs, um die gemeinsame Verteilung vorzuschreiben. Daher sind sie grafische Modelle.

Vorteile:

  1. Wenn Sie viele fehlende Daten haben, z. B. in der Medizin, können BNs sehr effektiv sein, da die Modellierung der Gelenkverteilung (dh Ihre Aussage darüber, wie die Daten generiert wurden) Ihre Abhängigkeit von einem vollständig beobachteten Datensatz verringert.

  2. Ursachebewirken

  3. Das Erlernen der gemeinsamen Verteilung ist eine schwierige Aufgabe. Die Modellierung für diskrete Variablen (durch Berechnung bedingter Wahrscheinlichkeitstabellen, dh CPTs) ist jedoch wesentlich einfacher als der Versuch, dasselbe für kontinuierliche Variablen zu tun. Daher sind BNs bei diskreten Variablen praktisch häufiger.

  4. BN erlauben nicht nur Beobachtungsinferenz (wie es alle maschinellen Lernmodelle erlauben), sondern auch kausale Eingriffe . Dies ist ein häufig vernachlässigter und unterschätzter Vorteil von BN und steht im Zusammenhang mit kontrafaktischen Überlegungen.

Zhubarb
quelle
1
Beeinflussen diese fehlenden Werte in Vorteil 1, in dem Sie sagen, dass BNs für die Modellierung von Daten mit vielen fehlenden Werten effektiv sind, nicht die korrekte Identifizierung von Abhängigkeiten in den Daten?
Hossein
1
P(Y.,X1,X2)X1X2
1

Nach meiner Erfahrung funktionieren Bayesian Networks sehr gut, wenn hochdimensionale kategoriale Daten vorliegen . Sie liefern interpretierbare Modelle, die (manchmal) dazu beitragen, das Zusammenspiel der verschiedenen Variablen zu verstehen.

Bräunen
quelle