Ein Teilmengen-Suchalgorithmus

9

Angenommen, ich habe eine Liste von Teilmengen von . Bei Bedarf kann ich diese Liste vorverarbeiten. Nach dieser Vorverarbeitung wird mir eine weitere Menge . Ich möchte alle Mengen mit identifizieren . $\cal X$ $\{1, ..., n\}$ $A \subseteq \{1, ..., n \}$ $B \in \mathcal X$ $B \subseteq A$

Der offensichtliche Algorithmus (ohne Vorverarbeitung) benötigt Zeit - Sie testen einfach gegen jedes separat. Gibt es etwas Besseres als das? $O(n |\cal X|)$ $A$ $B \in \mathcal X$

Wenn es hilft, können Sie davon ausgehen, dass für jedes die Gesamtzahl der Übereinstimmungen durch etwas wie . $A$ $B \in \mathcal X$ $O(1)$

ds.algorithms ds.data-structures David Harris
quelle

3

Dies ist keine Antwort. Es ist eine einfache, aber lange Beobachtung. Ich hoffe es wird nützlich sein.

Die Entscheidungsversion Ihres Problems lautet: Enthält eine Teilmenge von ? $\cal X$ $A$

$n$ $\{1,\ldots,n\}$ $n$ $\cal X$ $f$ $n$ $f$ $f$ $g(y)=(\exists x\subseteq y,\,f(x))$ $g(A)$ $f=g$ $f$ $\cal X$

$f$ $g$ $g$ $g$ $\Omega\left(\binom{n}{n/2}\right)$

Aber (1) eine bessere Analyse könnte möglich sein und (2) es könnte Verbesserungen an diesem Ansatz geben, die ihn besser machen. Zum Beispiel habe ich die Korrelation zwischen der Größe von und der Größe von BDD in keiner Weise verwendet . (Es muss eine Korrelation geben, aber ich weiß nicht, ob es hier einfach oder verwendbar ist.) $\cal X$ $g$

Der Vollständigkeit halber ist ein einfacher Algorithmus zum Berechnen der BDD für aus der BDD für der folgende. Hier ist die Standard- oder Operation für BDDs. $g$ $f$

m (x ? f_{1} : f_{0}) = x ? (m (f_{0}) \lor m (f_{1})) : m (f_{0})

$m(x?f_1:f_0)=x?(m(f_0)\lor m(f_1)):m(f_0)$

\lor

$\lor$

Radu GRIGore
quelle

2

Ist dies nicht mehr oder weniger gleichbedeutend mit der Vorberechnung der Antwort für jede Teilmenge von , dem Zwischenspeichern aller Ergebnisse in einem Binärbaum der Größe und dem anschließenden Nachschlagen nach rechts? Ergebnis (in Zeit ), wenn Sie ?

{1, 2, . . ., n}

$\{1,2,...,n\}$

2^{n}

$2^n$

O (n)

$O(n)$

A

$A$

mjqxxxx

Die Verwendung von exponentiellem Speicherplatz zum Speichern vorverarbeiteter Daten klingt für mich nach Betrug, obwohl dies in der Frage nicht verboten ist. Aber ich bin vielleicht voreingenommen gegenüber der Kirche der schlimmsten Komplexität.

Tsuyoshi Ito

mjqxxxx und Tsuyoshi: Ich stimme Ihnen beiden zu. Ich habe den Text so umgeschrieben, dass ich hoffe, es ist klarer, dass ich damit einverstanden bin. :)

Radu GRIGore

3

Vielleicht können Sie eine "Information Retrieval" -Technik verwenden: Erstellen Sie in der Vorverarbeitungsphase einen invertierten Index (in Ihrem Fall reicht ein einfaches zweidimensionales Array aus), der ein Element abbildet zu den Mengen in , die es enthalten: . $n \times | {\cal X}|$ $x_i \in \{1,...,n\}$ $\cal X$ $inv(x_i)= \{ X_j \in {\cal X} \; | \; x_i \in X_j \}$

Set eines Integer - Array up der Länge. $occ$ $|\cal X|$

Dann für jede abrufen , und für jede do $y_i \in A$ $inv(y_i)$ $X_j \in inv(y_i)$ $occ[j] = occ[j]+1$

Am Ende benötigen Sie die Mengen, für die . $|X_j|=occ[j]$

Sie können den Prozess beliebig beschleunigen (auf Kosten des exponentiellen Raums), indem Sie zwei oder mehr Elemente zusammen indizieren.

Marzio De Biasi
quelle

Ein Teilmengen-Suchalgorithmus

Antworten: