Ich implementiere PCA, LDA und Naive Bayes für die Komprimierung bzw. Klassifizierung (Implementierung einer LDA für die Komprimierung und Klassifizierung).
Ich habe den Code geschrieben und alles funktioniert. Was ich für den Bericht wissen muss, ist die allgemeine Definition des Rekonstruktionsfehlers .
Ich kann viel Mathematik finden und in der Literatur verwenden ... aber was ich wirklich brauche, ist eine Vogelperspektive / einfache Wortdefinition, damit ich sie an den Bericht anpassen kann.
general definition of reconstruction error
schwer fassbar ist.Antworten:
Für PCA projizieren Sie Ihre Daten auf eine Teilmenge Ihres Eingabebereichs. Grundsätzlich gilt alles für dieses Bild oben: Sie projizieren Daten mit maximaler Varianz auf den Unterraum. Wenn Sie Ihre Daten aus der Projektion rekonstruieren, erhalten Sie die roten Punkte, und der Rekonstruktionsfehler ist die Summe der Abstände von blauen zu roten Punkten: Er entspricht in der Tat dem Fehler, den Sie beim Projizieren Ihrer Daten auf das Grün gemacht haben Linie. Es kann natürlich in jeder Dimension verallgemeinert werden!
Wie in den Kommentaren erwähnt, scheint es für LDA nicht so einfach zu sein, und ich kann im Internet keine richtige Definition finden. Es tut uns leid.
quelle
Die allgemeine Definition des Rekonstruktionsfehlers wäre der Abstand zwischen dem ursprünglichen Datenpunkt und seiner Projektion auf einen unterdimensionalen Unterraum (seine "Schätzung").
Quelle: Spezialisierung Mathematik des maschinellen Lernens am Imperial College London
quelle
Berechnung
Berechnung
Wenn Sie Python verwenden, können Sie diese wie folgt berechnen:
Wo
X
sind die Originaldaten undf
sind die komprimierten Daten.Visualisierung
quelle