Die Antworten hier haben festgestellt, dass die Dimensionen in t-SNE bedeutungslos sind und dass die Abstände zwischen Punkten kein Maß für die Ähnlichkeit sind .
Können wir jedoch etwas über einen Punkt sagen, der auf seinen nächsten Nachbarn im t-SNE-Raum basiert? Diese Antwort darauf , warum Punkte, die genau gleich sind, nicht gruppiert werden, legt nahe, dass das Verhältnis der Abstände zwischen Punkten zwischen niedrig- und höherdimensionalen Darstellungen ähnlich ist.
Das folgende Bild zeigt beispielsweise t-SNE in einem meiner Datensätze (15 Klassen).
Kann ich sagen, dass cro 479
(oben rechts) ein Ausreißer ist? Ist fra 1353
(unten links) ähnlicher cir 375
als die anderen Bilder in der fra
Klasse usw.? Oder könnten dies nur Artefakte sein, z. B. fra 1353
auf der anderen Seite einiger Cluster stecken bleiben und sich nicht in die andere fra
Klasse durchsetzen können?
Antworten:
Nein, es ist nicht notwendig, dass dies der Fall ist, dies ist jedoch in verschlungener Weise das Ziel von T-SNE.
Bevor wir uns mit der Antwort befassen, werfen wir einen Blick auf einige grundlegende Definitionen, sowohl mathematisch als auch intuitiv.
Nun endlich ein ordentliches Codierungsbeispiel, das auch dieses Konzept demonstriert.
Obwohl dies ein sehr naives Beispiel ist und nicht die Komplexität widerspiegelt, funktioniert es experimentell für einige einfache Beispiele.
EDIT: Wenn Sie einige Punkte in Bezug auf die Frage selbst hinzufügen, ist es nicht erforderlich, dass dies der Fall ist. Eine Rationalisierung durch Mathematik könnte jedoch beweisen, dass Sie kein konkretes Ergebnis haben (kein definitives Ja oder Nein). .
Ich hoffe, dies hat einige Ihrer Bedenken gegenüber TSNE ausgeräumt.
quelle