Ich habe eine grafische Darstellung der linearen Diskriminanzanalyse (LDA) mit Entscheidungsgrenzen aus den Elementen des statistischen Lernens gesehen :
Ich verstehe, dass Daten auf einen unterdimensionalen Unterraum projiziert werden. Ich möchte jedoch wissen, wie wir die Entscheidungsgrenzen in der ursprünglichen Dimension erhalten, so dass ich die Entscheidungsgrenzen auf einen unterdimensionalen Unterraum projizieren kann (wie die schwarzen Linien im obigen Bild).
Gibt es eine Formel, mit der ich die Entscheidungsgrenzen in der ursprünglichen (höheren) Dimension berechnen kann? Wenn ja, welche Eingaben benötigt diese Formel?
r
references
discriminant-analysis
mein Name ist Jeff
quelle
quelle
they (bondaries) are never computed. The plot is drawn by classifying every character cell in it, then blanking out all those surrounded by cells classified into the same category
.Antworten:
Diese besondere Figur in Hastie et al. wurde ohne Berechnung von Gleichungen von Klassengrenzen hergestellt. Stattdessen wurde der in den Kommentaren durch @ttnphns umrissene Algorithmus verwendet, siehe Fußnote 2 in Abschnitt 4.3, Seite 110:
Ich werde jedoch mit der Beschreibung fortfahren, wie Gleichungen von LDA-Klassengrenzen erhalten werden.
Beginnen wir mit einem einfachen 2D-Beispiel. Hier sind die Daten aus dem Iris-Datensatz . Ich verwerfe die Blütenblattmessungen und berücksichtige nur die Kelchblattlänge und -breite. Drei Klassen sind rot, grün und blau markiert:
Lassen Sie uns Klassenmittel (Zentroide) als . Die LDA geht davon aus, dass alle Klassen innerhalb der Klasse die gleiche Kovarianz aufweisen. Wenn die Daten gegeben sind, wird diese gemeinsame Kovarianzmatrix (bis zur Skalierung) als W = ∑ i ( x i - μ k ) ( x i - μ k ) ⊤ geschätzt , wobei die Summe über alle Datenpunkte und den Schwerpunkt des jeweiligen ist Klasse wird von jedem Punkt abgezogen.μ1,μ2,μ3 W=∑i(xi−μk)(xi−μk)⊤
Für jedes Klassenpaar (zB Klasse und 2 ) gibt es eine Klassengrenze zwischen ihnen. Es ist offensichtlich, dass die Grenze durch den Mittelpunkt zwischen den beiden Klassenschwerpunkten ( μ 1 + μ 2 ) / 2 verlaufen muss . Eines der zentralen LDA-Ergebnisse ist, dass diese Grenze eine zu W - 1 ( μ 1 - μ 2 ) orthogonale Gerade ist . Es gibt mehrere Möglichkeiten, um dieses Ergebnis zu erhalten, und obwohl dies nicht Teil der Frage war, möchte ich im Anhang unten drei davon kurz erwähnen.1 2 (μ1+μ2)/2 W−1(μ1−μ2)
Beachten Sie, dass das, was oben geschrieben wurde, bereits eine genaue Spezifikation der Grenze ist. Wenn man eine Geradengleichung in der Standardform haben möchte , dann können die Koeffizienten a und b berechnet werden und werden durch einige unordentliche Formeln angegeben. Ich kann mir kaum eine Situation vorstellen, in der dies nötig wäre.y=ax+b a b
Wenden wir diese Formel nun auf das Beispiel Iris an. Für jedes Klassenpaar finde ich einen Mittelpunkt und zeichne eine Linie senkrecht zu :W−1(μi−μj)
Wie zu erwarten, schneiden sich drei Linien in einem Punkt. Entscheidungsgrenzen werden durch Strahlen gegeben, die vom Schnittpunkt ausgehen:
Blinddarm
quelle