Sprachen, die von DFAs mit Polynomgröße erkannt werden

23

Für ein festes endliches Alphabet , eine formale Sprache über ist regelmäßig , wenn es einen gibt deterministische endliche Automaten (DFA) über , die akzeptiert genau .L Σ Σ LΣLΣΣL

Ich interessiere mich für Sprachen, die "fast" regelmäßig sind, in dem Sinne, dass sie von Automatenfamilien erkannt werden können, deren Größe nur polynomiell mit der Wortlänge wächst.

Formal lassen Sie mich sagen , dass eine formale Sprache wird anerkannt durch eine DFA - Familie , wenn für jedes Wort , im Stich gelassen, ist in wenn akzeptiert (egal ob das andere akzeptiert oder nicht), und lassen Sie mich p-reguläre Sprachen als Sprachen definieren, die von einer PTIME-berechenbaren DFA-Familie mit polynomieller Größe erkannt werden , und zwar dort ist ein Polynom so dass für alleL w & Sigma; * n = | w | w L A n w A i(An)wΣn=|w|wLAnwAiP | A n | P ( n ) n(An)P|An|P(n)n. (Diesen Namen "p-regular" habe ich mir ausgedacht. Ich möchte wissen, ob es dafür bereits einen anderen Namen gibt. Beachten Sie, dass dies nicht mit p-regular-Sprachen im Sinne von Permutationsautomaten identisch ist .)

Diese Klasse von p-regulären Sprachen umfasst natürlich reguläre Sprachen (nimm einfach für alle , wobei ein DFA ist, das die reguläre Sprache erkennt); aber es ist eine strenge Obermenge davon: Zum Beispiel ist bekannt, dass kontextfrei, aber nicht regulär ist, aber es ist p- regular ( nur Vorkommen von und Vorkommen von ). Da es sich bei den Automaten jedoch um polynomgroße DFAs handeln muss , sind dies bei einigen formalen Sprachen (tatsächlich bei einigen kontextfreien Sprachen) nicht der Falln A { a n b nn N } A n n a n bAn=AnA{anbnnN}Annanbp-regular: Zum Beispiel ist die Sprache der Palindrome nicht p-regular, weil Sie intuitiv, wenn Sie die erste Hälfte eines Wortes gelesen haben, so viele verschiedene Zustände haben müssen, wie es mögliche Wörter gibt, weil Sie brauchen werden genau diese erste Hälfte mit der zweiten abzustimmen.

Die Klasse der p-regulären Sprachen ist also eine strikte Obermenge regulärer Sprachen, die mit kontextfreien Sprachen nicht zu vergleichen ist. Tatsächlich scheint es, dass Sie sogar eine Hierarchie von Sprachen erhalten können, indem Sie p-reguläre Sprachen basierend auf dem kleinsten Grad des Polynoms für das sie -regulär sind, unterscheiden . Es ist nicht schwer, Beispiele zu konstruieren, um zu zeigen, dass diese Hierarchie streng ist. obwohl ich die Wechselwirkung zwischen dieser und einer alternativen Definition der Hierarchie, die auch die Komplexität der Berechnung von einschränken würde, noch nicht gut verstehe .P A nPPAn

Meine Frage ist: Wurde diese Klasse, die ich p-regular nenne, und die zugehörige Hierarchie zuvor untersucht? Wenn ja, wo und unter welchem ​​Namen?

(Eine mögliche Verknüpfung besteht mit dem Feld- oder Streaming-Algorithmus oder dem Online-Algorithmus. In der Terminologie des Streaming-Algorithmus für Spracherkennungsprobleme interessiert mich die Klasse (oder Hierarchie) von Sprachen, die einen deterministischen Erkennungsalgorithmus mit einem Durchgang haben können. unter Verwendung einer polynomiellen Anzahl von Zuständen (also einer logarithmischen Speichergröße), aber ich habe keine Definition dieser Klasse in dieser Abhandlung oder verwandten Abhandlungen gefunden. Beachten Sie jedoch, dass in meiner Formulierung des Problems die Länge des Wortes im Voraus bekannt ist , Was in einem Streaming-Kontext weniger natürlich ist: Im Streaming könnte man dies als einen unendlichen Automaten, ein spezielles "Wortende" -Symbol und eine Einschränkung sehen, dass die Anzahl der erreichbaren Zustände nach dem Lesen von Zeichen in polynomisch istnnn. Ich denke, dass diese Unterscheidung einen Unterschied macht, mögliches Beispiel: Sprache von binären Wörtern, deren Wert durch ihre Länge teilbar ist, die für eine feste Länge einfach ist, aber (ich nehme an) nicht durch einen unendlichen Automaten im bisherigen Sinne dargestellt werden kann, weil keine Identifikationen vorliegen kann gemacht werden, wenn die Länge nicht im Voraus bekannt ist.)

(Die Motivation für diese p-reguläre Klasse ist, dass einige Probleme, wie die Wahrscheinlichkeit einer Sprachzugehörigkeit für probabilistische Wörter, PTIME zu sein scheinen, nicht nur, wenn die Sprache regulär ist, sondern auch, wenn sie p-regulär ist, und ich versuche es genau zu charakterisieren, unter welchen Umständen diese Probleme auffindbar sind.)

a3nm
quelle
1
Argh, ich hatte die Frage nach der Berechenbarkeit von nicht richtig bedacht . Vielen Dank für den Hinweis. Ich habe gerade die Anforderung hinzugefügt, dass sie berechenbar sind. Hoffentlich gibt es keine schlechten Situationen für p-reguläre Sprachen, in denen berechenbare Familien mit hoher Komplexität ? ( A n )(An)(An)
a3nm
1
Ok, ich habe den "nicht berechenbaren" Kommentar gelöscht. Aber selbst mit der berechenbaren Einschränkung können Sie immer noch seltsame Dinge bekommen, wie: Wählen Sie und ist NEXP-vollständig ( ansonsten ). Vielleicht können Sie es weiter einschränken, indem Sie die Bedingung hinzufügen, dass eine berechenbare Polynomzeit sein muss?!? B A n = A nAn={1nnB}BAn=An
Marzio De Biasi
1
Marzio: Argh, du hast recht. Für meine Motivation ist die richtige Vorstellung, dass die PTIME-berechenbar sind, ja, also habe ich dies geändert ... dennoch stört es mich ein bisschen, dass die Komplexität der Berechnung der einen solchen Einfluss auf die resultierende Klasse hat (weil dies bedeutet, dass dies eine zusätzliche Auswahl ist, die in der Definition getroffen werden muss ...). Dies kompliziert auch das Bild der Hierarchie, an die ich gedacht habe. ( A n )An(An)
Uhr
2
Ich verstehe nicht, was an der Unberechenbarkeit falsch ist. Was Sie definieren, ist eine nicht einheitliche Sprachklasse, wie viele Schaltungsklassen.
Domotorp
3
Wenn Sie die Einheitlichkeitsbedingung für den Protokollbereich verbessern, können alle diese Sprachen im Protokollbereich berechnet werden. Unter der gegebenen Definition sind alle p-regulären Sprachen in "P-Uniform L" (erkennbar an einer P-Uniform-Familie von Verzweigungsprogrammen oder an einem logspace TM mit einem p-time-computable advice).
Emil Jeřábek unterstützt Monica

Antworten:

3

die Frage scheint nicht viel untersucht worden zu sein (eine Möglichkeit ist der Versuch, eine Beziehung zu einer "nahe gelegenen" Komplexitätsklasse zu finden, z. B. P / Poly usw.); Hier ist allerdings mindestens ein Hinweis, der darauf eingeht:

  • Sprachoperationen mit regulären Ausdrücken der Polynomgröße Gruber / Holzer

    Diese Arbeit beschäftigt sich mit Fragen, inwieweit reguläritätserhaltende Sprachoperationen die beschreibende Komplexität regulärer Ausdrücke beeinflussen. Es werden einige Sprachoperationen identifiziert, die für reguläre Ausdrücke in dem Sinne durchführbar sind, dass das Ergebnis der Operation als regulärer Ausdruck eines Größenpolynoms in dem der Operanden dargestellt werden kann. Wir beweisen, dass die Verwendung von Sprachquotienten, insbesondere der Präfix- und Suffix-Abschlüsse, einer regulären Menge höchstens zu einer quadratischen Vergrößerung der erforderlichen Ausdrucksgröße führen kann. Der Umlaufbetrieb kann nur eine kubische Vergrößerung bewirken und im schlimmsten Fall kann zumindest ein quadratisches Aufblähen notwendig sein.

Wie AS andeutet, kann es andere, natürlichere Möglichkeiten geben, etwas wie die gestellte Frage zu studieren. Hier ist ein anderer, etwas ähnlicher Weg, das Wachstum einer regulären Sprache basierend auf der Anzahl der Wörter der Größe zu studieren, der eine lose Beziehung zu der Frage hat, zn

vzn
quelle
4
Obwohl es dort nicht explizit angegeben ist, impliziert der Beweis des Hauptergebnisses der folgenden Arbeit, dass die Klasse der p-regulären Sprachen nicht in monotoner NC ^ 1 enthalten ist. H. Gruber und J. Johannsen: "Optimale untere Schranken für die Größe regulärer Ausdrücke unter Verwendung von Kommunikationskomplexität", FoSSaCS 2008, LNCS 4962, S. 273-286. hermann-gruber.com/data/fossacs08.pdf
Hermann Gruber
1
Nachtrag, lief über diese Doktorarbeit 2010 Komplexitätsklassen von endlichen Automaten / Kralovic, die etwas Ähnliches definieren, was für p11 für "kleine Sprachen" verlangt wird. Es scheint eine umfassende Übersicht über diesen Gesamtbereich zu sein und baut einen allgemeinen theoretischen Rahmen / Abstraktionen verwandter Konzepte auf. Es gibt jedoch nicht viele Theoreme, die sich direkt auf die spezifische Klasse der "P-Größen-DFA-Familien" beziehen.
vzn
1
@vzn: Die Definition in Seite 11 von Kralovics These ist etwas anders, weil es sich um Sprachfamilien handelt, während in meiner Frage die verschiedenen Sprachen Wörter mit fester Länge sind, die nur aus einer Hauptsprache stammen. Ich bin mir auch nicht sicher, welchen Zusammenhang Sie mit dem Papier von Gruber und Holzer haben, ich sehe nicht, wie Sie sich in meiner Frage vorstellen können, dass die Automaten das Ergebnis von Operationen zur Wahrung der Regelmäßigkeit im Allgemeinen sind. Was Gawrychowski et al betrifft, stimme ich zu, dass dies möglicherweise tangential zusammenhängt.
Am
2
Der Gruber / Holzer-Hinweis scheint bei der Idee von P-regulären Reduzierungen für Eigenschaften vom Typ "P-regulärer Verschluss" zu helfen. stimmte zu, dass Ihr Def anders zu sein scheint als alles andere, was untersucht wurde. Mit anderen Worten, es gibt vermutlich Reduktionen zwischen einigen dieser Probleme / Klassen und die Refs gehen in diese Richtungen. Man könnte nach reduktionsähnlichen Operationen suchen, die Ihre Def mit zuvor untersuchten / veröffentlichten Klassen verbinden (vereinbart, dass Ihre Defn keine bestimmten impliziert) Verkleinerungsoperationen). Vielleicht lautet die strikte Antwort auf Ihre Frage "Nein, Ihre Klasse wurde nicht genau untersucht"
vzn