Ich bin kürzlich auf das Einbetten von Graphen wie DeepWalk und LINE gestoßen. Ich habe jedoch immer noch keine klare Vorstellung davon, was unter Grafikeinbettungen zu verstehen ist und wann sie zu verwenden sind (Anwendungen). Anregungen sind willkommen!
12
Antworten:
Durch das Einbetten von Diagrammen wird eine Zuordnung von einem Netzwerk zu einem Vektorraum unter Beibehaltung der relevanten Netzwerkeigenschaften erlernt.
Vektorräume sind für die Datenwissenschaft zugänglicher als Diagramme. Diagramme enthalten Kanten und Knoten. In diesen Netzwerkbeziehungen kann nur eine bestimmte Teilmenge von Mathematik, Statistik und maschinellem Lernen verwendet werden. Vektorräume verfügen über ein umfangreicheres Toolset aus diesen Domänen. Darüber hinaus sind Vektoroperationen oft einfacher und schneller als die entsprechenden Graphoperationen.
Ein Beispiel ist die Suche nach nächsten Nachbarn. Sie können in einem Diagramm "Sprünge" von einem Knoten zu einem anderen Knoten ausführen. In vielen realen Diagrammen gibt es nach ein paar Sprüngen wenig aussagekräftige Informationen (z. B. Empfehlungen von Freunden von Freunden von Freunden). In Vektorräumen können Sie jedoch Abstandsmetriken verwenden, um quantitative Ergebnisse zu erhalten (z. B. Euklidianabstand oder Kosinusähnlichkeit). Wenn Sie quantitative Abstandsmetriken in einem aussagekräftigen Vektorraum haben, ist es einfach, die nächsten Nachbarn zu finden.
" Graph Embedding-Techniken, -Anwendungen und -Leistung: Eine Umfrage " ist ein Übersichtsartikel, der ausführlicher behandelt wird.
quelle
Was sind Grafik-Einbettungen? "Graph Embeddings" ist heute ein heißer Bereich im maschinellen Lernen. Es bedeutet im Grunde, eine "latente Vektordarstellung" von Graphen zu finden, die die Topologie (im einfachsten Sinne) des Graphen erfasst. Wir können diese "Vektordarstellung" bereichern, indem wir auch die Vertex-Vertex-Beziehungen, Kanteninformationen usw. berücksichtigen. Das Diagramm enthält ungefähr zwei Einbettungsebenen (natürlich können wir jederzeit weitere Ebenen definieren, indem wir das gesamte Diagramm logisch aufteilen Subgraphen verschiedener Größen):
Anwendungen - Bei genauer Betrachtung handelt es sich bei Einbettungen um "latente" Darstellungen, dh wenn ein Graph ein | V | hat * | V | Adjazenzmatrix wobei | V | = 1M, es ist schwierig, 1M * 1M-Zahlen in einem Algorithmus zu verwenden oder zu verarbeiten. Eine latente Einbettung der Dimension 'd' mit d << | V | würde also die Adjazenzmatrix | V | ergeben * d und relativ einfach zu bedienen. Eine andere Anwendung könnte sein: - Stellen Sie sich ein einfaches Szenario vor, in dem wir den Personen, die ähnliche Interessen an einem sozialen Netzwerk haben, Produkte empfehlen möchten. Durch das Abrufen von Vertex-Einbettungen (hier bedeutet dies die Vektordarstellung jeder Person) können wir ähnliche finden, indem wir diese Vektoren zeichnen. Dies erleichtert die Empfehlung. Dies sind einige Anwendungen und es gibt andere. Sie können sich auf ein schönes Umfragepapier beziehen - Graph Embedding Techniques, eine Umfrage .
Woher kam das alles? Es gab viele Arbeiten in diesem Bereich und fast alle stammen aus der bahnbrechenden Forschung auf dem Gebiet der Verarbeitung natürlicher Sprache - "Word2Vec" von Mikolov. Wenn Sie mit der Untersuchung von Grafikeinbettungen beginnen möchten, empfehle ich, zunächst zu verstehen, wie Word2Vec funktioniert. Hier finden Sie nette Erklärungen - das Erlernen von Word2Vec-Parametern und Stanford Lecture . Dann können Sie zu den Papieren springen, die Sie aufgelistet haben. Diese Werke können kategorisiert werden als:
Arbeiten basierend auf "Vertex Embeddings": - DeepWalk , Node2Vec , LINE .
Arbeiten basierend auf "Graph Embeddings": - Deep Graph Kernels , Subgraph2Vec .
quelle
In dem Aufsatz Ein zentraler Grenzwertsatz für eine Omnibus-Einbettung zufälliger Punktproduktgraphen von Levin et al. Papier, definiert eine bestimmte Art der Graph-Einbettung (die Omnibus-Einbettung) die Graph-Einbettung als eine Methode, "bei der die Eckpunkte eines Graphen Vektoren in einem niedrigdimensionalen euklidischen Raum zugeordnet werden". Überprüfen Sie den Link für weitere Informationen.
quelle