Ich versuche die Unterschiede zwischen den linearen Dimensionalitätsreduktionsmethoden (z. B. PCA) und den nichtlinearen Methoden (z. B. Isomap) zu verstehen.
Ich kann nicht ganz verstehen, was die (Nicht-) Linearität in diesem Zusammenhang impliziert. Ich lese aus Wikipedia , dass
Im Vergleich dazu sind die resultierenden Werte nicht so gut organisiert, wenn PCA (ein linearer Dimensionsreduktionsalgorithmus) verwendet wird, um denselben Datensatz in zwei Dimensionen zu reduzieren. Dies zeigt, dass die hochdimensionalen Vektoren (die jeweils einen Buchstaben "A" darstellen), die diese Mannigfaltigkeit abtasten, nichtlinear variieren.
Was macht
Die hochdimensionalen Vektoren (die jeweils einen Buchstaben "A" darstellen), die diese Mannigfaltigkeit abtasten, variieren nicht linear.
bedeuten? Oder allgemeiner: Wie verstehe ich die (Nicht-) Linearität in diesem Zusammenhang?
quelle
Ein Bild sagt mehr als tausend Worte:
Hier suchen wir nach einer eindimensionalen Struktur in 2D. Die Punkte liegen entlang einer S-förmigen Kurve. PCA versucht, die Daten mit einer linearen eindimensionalen Mannigfaltigkeit zu beschreiben, die einfach eine Linie ist; Natürlich passt eine Zeile ziemlich schlecht zu diesen Daten. Isomap sucht nach einer nichtlinearen (dh gekrümmten!) Eindimensionalen Mannigfaltigkeit und sollte in der Lage sein, die zugrunde liegende S-förmige Kurve zu erkennen.
quelle