Ich habe zwei Partitionen von und suche nach dem Bearbeitungsabstand zwischen ihnen.
Auf diese Weise möchte ich die minimale Anzahl von einzelnen Übergängen eines Knotens in eine andere Gruppe finden, die erforderlich sind, um von Partition A zu Partition B zu gelangen.
Zum Beispiel wäre der Abstand von {0 1} {2 3} {4}
in {0} {1} {2 3 4}
zwei
Nach der Suche bin ich auf dieses Papier gestoßen, aber a) ich bin nicht sicher, ob sie die Reihenfolge der Gruppen (etwas, das mir egal ist) in ihrer Entfernung berücksichtigen. B) ich bin nicht sicher, wie es funktioniert und c) Es gibt keine Referenzen.
Jede Hilfe dankbar
Antworten:
Dieses Problem kann in das Zuordnungsproblem umgewandelt werden , das auch als maximal gewichtetes zweiteiliges Übereinstimmungsproblem bezeichnet wird.
Beachten Sie zunächst, dass der Bearbeitungsabstand der Anzahl der Elemente entspricht, die von einem Satz zum anderen geändert werden müssen. Dies entspricht der Gesamtzahl der Elemente abzüglich der Anzahl der Elemente, die nicht geändert werden müssen. Das Ermitteln der minimalen Anzahl von Elementen, die sich nicht ändern, entspricht dem Ermitteln der maximalen Anzahl von Scheitelpunkten, die sich nicht ändern.
Sei und Partitionen von . Auch ohne Verlust der Allgemeinheit sei (erlaubt, weil ). Dann sei , , ..., die leere Menge. Dann ist die maximale Anzahl von Scheitelpunkten, die sich nicht ändern:B = { B 1 , B 2 , . . . , B l } [ 1 , 2 , . . . , N ] k ≥ l e d i t ( A , B ) = e d i t (A={A1,A2,...,Ak} B={B1,B2,...,Bl} [1,2,...,n] k≥l B L + 1 B l + 2 B kedit(A,B)=edit(B,A) Bl+1 Bl+2 Bk
wobei eine Permutation von .[ 1 , 2 , . . . , k ]f [1,2,...,k]
Dies ist genau das Zuordnungsproblem, bei dem die Eckpunkte , ..., , , ..., und die Kanten Paare mit dem Gewicht. Dies kann in gelöst werden.A k B 1 B k ( A i , B j ) | A i ∩ B j | O ( | V | 2 log | V | + | V | | E | )A1 Ak B1 Bk (Ai,Bj) |Ai∩Bj| O(|V|2log|V|+|V||E|)
quelle
Schauen Sie sich das PDF dieses Papiers an
http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.0030160
Die Definition des Bearbeitungsabstands ist genau das, was Sie brauchen, denke ich. Die 'Referenz'-Partition wäre (eine beliebige) Ihrer beiden Partitionen, die andere wäre einfach die andere. Enthält auch relevante Zitate.
Am besten, Rob
quelle
Verschrobener Sonntagmorgen-Gedanke, der richtig oder falsch sein könnte:
Wlog, sei die Partition mit mehr Mengen, die andere. zunächst Ihren Mengen paarweise unterschiedliche Namen zu . Dann finden Sie eine beste Benennung für die Mengen nach den folgenden Regeln:P 2 N - 1 ( S ) ∈ & Sigma; P 1 n 2 ( S ) , P 2P1 P2 n1(S)∈Σ P1 n2(S) P2
Nun können Sie die Bitfolgen Ihrer Elemente in jeder Partition betrachten, dh und . mit ). Die gewünschte Größe ist dann , dh der Hamming-Abstand zwischen den Bitfolgen.w 2 = n 2 ( 1 ) ⋅ ⋯ ⋅ n 2 ( n ) n j ( i ) = n j ( S ) , i ∈ S ∈ P j d H ( w 1 , w 2 )w1=n1(1)⋅⋯⋅n1(n) w2=n2(1)⋅⋯⋅n2(n) nj(i)=nj(S),i∈S∈Pj dH(w1,w2)
quelle