In welchen Situationen sollten wir t-SNE verwenden (abgesehen von der Datenvisualisierung)?
T-SNE wird zur Dimensionsreduzierung verwendet. Die Antwort auf diese Frage legt nahe, dass t-SNE nur zur Visualisierung und nicht zum Clustering verwendet werden sollte. Was nützt dann t-SNE?
Antworten:
Ich stimme dieser Schlussfolgerung nicht zu. Es gibt keinen Grund anzunehmen, dass t-SNE universell schlechter ist als jeder andere Clustering-Algorithmus. Jeder Clustering-Algorithmus nimmt Annahmen über die Struktur der Daten vor, und es ist zu erwarten, dass sie je nach zugrunde liegender Verteilung und Endverwendung der reduzierten Dimensionalität unterschiedlich funktionieren.
t-SNE bietet wie viele unbeaufsichtigte Lernalgorithmen häufig ein Mittel zum Zweck, z. B. um frühzeitig zu erkennen, ob die Daten trennbar sind oder nicht, um zu testen, ob sie eine identifizierbare Struktur aufweisen, und um die Art dieser Struktur zu untersuchen. Man muss nicht brauchen Visualisierung des t-SNE Ausgang Beantwortung einiger dieser Fragen zu starten. Andere Anwendungen von Einbettungen mit niedrigeren Dimensionen umfassen Gebäudemerkmale zur Klassifizierung oder Beseitigung der Multikollinearität, um die Leistung von Vorhersagemethoden zu verbessern.
quelle