Was sind die Bedingungen für eine NFA, damit ihre äquivalente DFA die maximale Größe hat?

Wir wissen, dass DFAs in ihrer Ausdruckskraft NFAs entsprechen; Es gibt auch einen bekannten Algorithmus zum Konvertieren von NFAs in DFAs (leider kenne ich jetzt den Erfinder dieses Algorithmus), der im schlimmsten Fall Zustände liefert , wenn unser NFA Zustände hat. $2^S$ $S$

Meine Frage ist: Was bestimmt das Worst-Case-Szenario?

Hier ist eine Transkription eines Algorithmus im Falle von Mehrdeutigkeiten:

Sei eine NFA. Wir konstruieren einen DFA wobei $A = (Q,\Sigma,\delta,q_0,F)$ $A' = (Q',\Sigma,\delta',q'_0,F')$

$Q' = \mathcal{P}(Q)$ ,
$F' = \{S \in Q' | F \cap S \neq \emptyset \}$ ,
$\delta'(S,a) =\bigcup_{s \in S} (\delta(s,a) \cup \hat \delta(s,\varepsilon))$ und
$q'_0 = \{q_0\} \cup \hat \delta(q_0, \varepsilon)$ ,

Wobei $\hat\delta$ die erweiterte Übergangsfunktion von $A$ .

formal-languages automata regular-languages finite-automata nondeterminism Daniil
quelle

Wie aus den Kommentaren hervorgeht, können Sie diesen Q retten, indem Sie nach einem "minimalen" NFA für einen DFA fragen (ein offenes Problem). Ich habe immer gedacht, dass dieses Problem auf verschiedene Weise eng mit der P =? NP-Frage verbunden ist und habe einige ähnliche Formulierungen, die dies nahelegen. Es ist insofern ähnlich, als Sie nach "komprimierbaren" und "inkomprimierbaren" DFAs fragen, bei denen "inkomprimierbaren" der schlimmste Fall ist, sodass die minimale NFA fast die Größe des DFA hat. Es gibt wahrscheinlich einige Theoreme wie "die meisten DFAs, die zufällig ausgewählt wurden, sind inkompressibel [in NFAs]", da es ähnliche Thms in der Informationstheorie bezüglich der Komplexität von Strings usw. gibt

vzn

Antworten:

Der Algorithmus, auf den Sie sich beziehen, heißt Powerset Construction und wurde erstmals 1959 von Michael Rabin und Dana Scott veröffentlicht.

Um Ihre Frage wie im Titel angegeben zu beantworten, gibt es keinen maximalen DFA für eine reguläre Sprache, da Sie immer einen DFA nehmen und so viele Zustände hinzufügen können, wie Sie möchten, mit Übergängen zwischen ihnen, aber ohne Übergänge zwischen einem der ursprünglichen Zustände und einer der neuen. Somit sind die neuen Zustände ab dem Anfangszustand nicht erreichbar , so dass sich die vom Automaten akzeptierte Sprache nicht ändert (da für alle gleich bleibt ). . $q_0$ $\hat\delta(q_0,w)$ $w\in\Sigma^*$

Das heißt, es ist klar, dass es keine Bedingungen für eine NFA geben kann, dass ihre äquivalente DFA maximal ist, da es keine eindeutige äquivalente DFA gibt. Im Gegensatz dazu ist der minimale DFA bis zum Isomorphismus einzigartig.

Ein kanonisches Beispiel einer Sprache, die von einem NFA mit Zuständen mit äquivalentem DFA von Zuständen akzeptiert wird , ist Ein NFA für ist mit , und für . Der DFA, der sich aus der Anwendung der Powerset-Konstruktion auf diesen NFA ergibt, hat Zustände, da Sie alle Wörter der Länge $n+1$ $2^n$

L = {w \in {0, 1}^{*} : | w | \geq n and the n -th symbol from the last one is 1} .

$L=\{w\in\{0,1\}^*:|w|\geq n\text{ and the $n$-th symbol from the last one is 1}\}.$

L

$L$

A = ⟨ Q, {0, 1}, δ, q_{0}, {q_{n + 1}} ⟩

$A=\langle Q,\{0,1\},\delta,q_0,\{q_{n+1}\}\rangle$

δ (q_{0}, 0) = {q_{0}}

$\delta(q_0,0)=\{q_0\}$

δ (q_{0}, 1) = {q_{0}, q_{1}}

$\delta(q_0,1)=\{q_0,q_1\}$

δ (q_{i}, 0) = δ (q_{i}, 1) = {q_{i + 1}}

$\delta(q_i,0)=\delta(q_i,1)=\{q_{i+1}\}$

i \in {1, \dots, n}

$i\in\{1,\ldots,n\}$

2^{n}

$2^n$

2^{n}

$2^n$

n

$n$ als Suffixe eines Wortes in .

L

$L$

Janoma
quelle

Übrigens, wenn Sie möchten, dass die geschweiften Klammern im mathematischen Anzeigemodus angezeigt werden, verwenden Sie \\ {und \\}.

Zach Langley

@ZachLangley Ich habe es bereits versucht, es funktioniert nicht :-(

Janoma

Es scheint für mich in der Vorschau zu funktionieren. Ich kann die Bearbeitung jedoch nicht einreichen, da ich nur vier Zeichen hinzufüge und das Minimum sechs beträgt. Du verwendest zwei Backslashes und es hat nicht funktioniert?

Zach Langley

@ZachLangley Es funktioniert jetzt, aber zwei Dinge: Erstens hat es nicht funktioniert, als ich die Antwort zum ersten Mal gepostet habe. Zweitens denke ich, dass dies nicht mit dem Verhalten des LaTeX-Renderns in cstheory vereinbar ist, aber ich könnte mich irren.

Janoma

Der resultierende DFA ist minimal? Könnten Sie ein wenig darüber sprechen, wie Sie beweisen können, dass es minimal ist?

User834

Der schlechteste Fall von ergibt sich aus der Anzahl der Teilmengen von Zuständen der NFA. Damit der Algorithmus aus Kleenes Theorem einen äquivalenten DFA mit der ungünstigsten Anzahl von Zuständen liefert, muss es eine Möglichkeit geben, zu jeder möglichen Teilmenge von Zuständen in der NFA zu gelangen. Ein Beispiel mit zwei Zuständen über dem Alphabet hat einen Übergang vom Anfangszustand zum einzigen Akzeptanzzustand bei Symbol , einen Übergang vom Akzeptanzzustand zurück zum Anfangszustand bei und einen Übergang vom Akzeptanzzustand zurück zu sich selbst entweder auf einem oder a . Die Saiten , , und $2^{s}$ $\{a, b\}$ $a$ $b$ $a$ $b$ $\lambda$ $a$ $b$ $ab$ führen zu Teilmengen , , und , und diese würden separate Zustände in der DFA benötigen, die Kleene gibt. $\{q_{1}\}$ $\{q_{2}\}$ $\{\}$ $\{q_{1}, q_{2}\}$

Patrick87
quelle

einverstanden, aber die Frage "ob es einen Weg gibt, zu jeder möglichen Untergruppe von Staaten in der NFA zu gelangen" ist nicht trivial und es lohnt sich eine weitere Untersuchung ...

vzn

-1

Ich glaube, dies ist eine Frage an der Grenze des Wissens, dh im Grunde genommen eine Forschungsfrage. Nach einer schnellen Google-Suche scheint es größtenteils offen zu sein. Außerdem habe ich jahrelang geglaubt, dass es wichtig und mit den unteren Grenzen der Komplexitätstheorie verbunden ist. Sie erwähnen eine statistische Analyse nicht direkt, aber das ist es, was Ihre Frage impliziert. Hier sind zwei Beispiele für statistische Studien zu DFAs / NFAs, die ähnlich sind, um den allgemeinen Ansatz für Fragen dieser Art zu zeigen. Die empirische Grundlagenforschung zu solchen Fragen ist offenbar noch weitgehend unerforscht. Zwar bezieht sich die zweite Frage nicht direkt auf Ihre Frage, aber es ist die aktuellste, die ich finden konnte.

$x$

Diese Metrik würde sich auf graphentheoretische Metriken wie Kantendichte usw. beziehen. Es gibt wahrscheinlich einige sehr wichtige Metriken der Graphentheorie oder eine Mischung von Metriken, die das "Aufblasen" schätzen, aber es ist für mich nicht sofort offensichtlich. Ich könnte vielleicht so etwas wie grafische Farbmetriken oder Clique-Metriken vorschlagen. Testen Sie dann die Metrik anhand der beiden Sätze "Aufblasen" und "Nicht aufgeblasen".

Andere Antworten auf Ihre Frage geben bisher nur einen Beispielfall für eine "Explosion" (nützlich für eine Fallstudie), gehen jedoch nicht auf das Hauptproblem einer allgemeinen Metrik ein.

Ein weiterer Bereich, in dem ein erfolgreich entwickeltes empirisches Forschungsprogramm untersucht werden muss, ist die SAT-Übergangspunktforschung. Das hat sehr tiefe Verbindungen zu physikalischen und thermodynamischen Konzepten entwickelt. Es scheint mir wahrscheinlich, dass ähnliche Konzepte hier anwendbar sind. Beispielsweise ist es wahrscheinlich, dass man analoge Metriken für Übergangspunkttypen findet; wahrscheinlich Kantendichte usw. Man beachte die Parallelen zur Kolmogorov-Kompressibilitätstheorie.

Ich vermute auch, dass NFAs, die "explodieren", im Vergleich zu solchen, die nicht ganz analog zu "harten" oder "einfachen" Fällen von NP-vollständigen Problemen sind.

Eine weitere Möglichkeit, dieses Problem zu untersuchen, wäre die Formulierung eines NFA-Minimierungsproblems. Das heißt, wenn ein DFA vorliegt, finde ich, dass der minimale NFA, den ich zuletzt gehört habe (vor vielen Jahren), immer noch ein offenes Problem war.

[1] Zur Leistung von Automatenminimierungsalgorithmen Marco Almeida, Nelma Moreira, Rogério Reis

[2] Automaten erkennen keine Worte: Ein statistischer Ansatz Cristian S. Calude, Cezar Câmpeanu, Monica Dumitrescu

vzn
quelle