Was nützt t-SNE neben der Datenvisualisierung?

12

In welchen Situationen sollten wir t-SNE verwenden (abgesehen von der Datenvisualisierung)?

T-SNE wird zur Dimensionsreduzierung verwendet. Die Antwort auf diese Frage legt nahe, dass t-SNE nur zur Visualisierung und nicht zum Clustering verwendet werden sollte. Was nützt dann t-SNE?

Wolfe
quelle
6
Der Standard-Rat ist, tsne NICHT für das Clustering zu verwenden, da die Cluster so stark von der Ratlosigkeit abhängen. Es soll nur zur "Visualisierung" verwendet werden. Aber das ist mir nicht sehr klar, da man beim Betrachten eines Tsne-Grundstücks sofort nach Clustern sucht (und diese sieht). Daher ist Ihre Frage gut: Wofür ist sie gut?
generic_user
2
Siehe die Antwort auf diese Frage, die ich gestellt habe: stats.stackexchange.com/questions/263539/…
generic_user
Wie der @ generic_user sagte, möchte ich neben der Visualisierung auch den Nutzen von t-sne kennenlernen.
Wolfe
Ich weiß nicht, warum dies als Duplikat geschlossen wurde. OP fragt, was die guten Verwendungsmöglichkeiten von t-sne neben der Visualisierung sind. Im verknüpften Thread dreht sich alles um Clustering. Es kann aber auch andere Verwendungszwecke geben.
Amöbe sagt Reinstate Monica
Siehe auch
Amelio Vazquez-Reina

Antworten:

4

Die Antwort auf diese Frage legt nahe, dass t-SNE nur zur Visualisierung und nicht zum Clustering verwendet werden sollte. Was nützt dann t-SNE?

Ich stimme dieser Schlussfolgerung nicht zu. Es gibt keinen Grund anzunehmen, dass t-SNE universell schlechter ist als jeder andere Clustering-Algorithmus. Jeder Clustering-Algorithmus nimmt Annahmen über die Struktur der Daten vor, und es ist zu erwarten, dass sie je nach zugrunde liegender Verteilung und Endverwendung der reduzierten Dimensionalität unterschiedlich funktionieren.

t-SNE bietet wie viele unbeaufsichtigte Lernalgorithmen häufig ein Mittel zum Zweck, z. B. um frühzeitig zu erkennen, ob die Daten trennbar sind oder nicht, um zu testen, ob sie eine identifizierbare Struktur aufweisen, und um die Art dieser Struktur zu untersuchen. Man muss nicht brauchen Visualisierung des t-SNE Ausgang Beantwortung einiger dieser Fragen zu starten. Andere Anwendungen von Einbettungen mit niedrigeren Dimensionen umfassen Gebäudemerkmale zur Klassifizierung oder Beseitigung der Multikollinearität, um die Leistung von Vorhersagemethoden zu verbessern.

Amelio Vazquez-Reina
quelle