Wenn zwei Klassen und eine Normalverteilung mit bekannten Parametern haben ( , als Mittel und , sind ihre Kovarianzen), wie können wir den Fehler des Bayes-Klassifikators für sie theoretisch berechnen?Σ 1 Σ 2
Angenommen, die Variablen befinden sich im N-dimensionalen Raum.
Hinweis: Eine Kopie dieser Frage ist auch unter https://math.stackexchange.com/q/11891/4051 verfügbar , die noch nicht beantwortet wurde. Wenn eine dieser Fragen beantwortet wird, wird die andere gelöscht.
Antworten:
Es gibt keine geschlossene Form, aber Sie können es numerisch tun.
Betrachten Sie als konkretes Beispiel zwei Gaußsche mit folgenden Parametern
Die optimale Klassifikatorgrenze von Bayes entspricht dem Punkt, an dem zwei Dichten gleich sind
Da Ihr Klassifikator an jedem Punkt die wahrscheinlichste Klasse auswählt, müssen Sie über die Dichte integrieren, die nicht für jeden Punkt die höchste ist. Für das obige Problem entspricht es den Volumina der folgenden Regionen
Sie können zwei Teile mithilfe eines numerischen Integrationspakets separat integrieren. Für das obige Problem verwende ich
0.253579
folgenden Mathematica-Codequelle
Es scheint, dass Sie dies auf zwei Arten tun können, je nachdem, welche Modellannahmen Sie gerne treffen.
Generativer Ansatz
Unter der Annahme eines generativen Modells für die Daten müssen Sie auch die vorherigen Wahrscheinlichkeiten jeder Klasse kennen, um eine analytische Aussage über den Klassifizierungsfehler zu erhalten. Suchen Sie nach Diskriminanzanalyse , um die optimale Entscheidungsgrenze in geschlossener Form zu erhalten, und berechnen Sie dann die Bereiche auf den falschen Seiten für jede Klasse, um die Fehlerraten zu erhalten.
Ich nehme an, dies der Ansatz von Ihrem Aufruf bestimmt ist der Bayes - Klassifikator, der nur definiert, wenn alles über den Datenerzeugungsprozess angegeben wird. Da dies selten möglich ist, lohnt es sich immer auch, das zu berücksichtigen
Diskriminierungsansatz
Wenn Sie die vorherigen Klassenwahrscheinlichkeiten nicht angeben möchten oder können, können Sie die Tatsache nutzen, dass die Diskriminanzfunktion unter vielen Umständen (ungefähr exponentielle bedingte Verteilungen von Familienklassen) direkt durch ein logistisches Regressionsmodell modelliert werden kann. Die Fehlerratenberechnung ist dann diejenige für das relevante logistische Regressionsmodell.
Für einen Vergleich der Ansätze und eine Diskussion der Fehlerraten können Jordan 1995 und Jordan 2001 sowie Referenzen von Interesse sein.
quelle
Hier finden Sie möglicherweise einige Hinweise für Ihre Frage, vielleicht gibt es nicht die vollständige Antwort, aber sicherlich sehr wertvolle Teile davon. http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2766788/
quelle
Zum Abschluss ist es nicht schwer, gute Referenzen zu finden, die den Fernseher zwischen multivariaten Gaußschen Verteilungen berechnen.
quelle