Asymptotik der Anzahl der Wörter in einer regulären Sprache von gegebener Länge

28

Für eine reguläre Sprache sei c n ( L ) die Anzahl der Wörter in L mit der Länge . Verwendung Jordan kanonische Form (angewandt auf die unkommentierten bergangsmatrix einige DFA für ) kann man zeigen , dass für ausreichend großen , Dabei sind komplexe Polynome und komplexe "Eigenwerte". (Für kleine können wir zusätzliche Terme der Form haben , wobei ist , wenn , undLcn(L)LnLn

cn(L)=i=1kPi(n)λin,
PiλinCk[n=k][n=k]1n=k0 sonst. Dies entspricht Jordan-Blöcken mit einer Größe von mindestens mit dem Eigenwert )k+10

Diese Darstellung scheint zu implizieren, dass, wenn unendlich ist, für etwas asymptotisch ist . Dies ist jedoch offensichtlich falsch: Für die Sprache über aller Wörter mit gerader Länge gilt aberLcn(L)CnkλnC,λ>0L{0,1}c2n(L)=22n . Dies legt nahe, dass für einige d und für alle a { 0 , , d - 1 } entweder c d m istc2n+1(L)=0da{0,,d1}fürgroß genugmoder c d m + a ~ C a (dm+a ) K a λ d m + a ein . Dies wird inFlajolet & Sedgewick(Satz V.3)bewiesen, der den Beweis Berstel zuschreibt.cdm+a(L)=0mcdm+aCa(dm+a)kaλadm+a

Der von Flajolet und Sedgewick vorgelegte Beweis ist etwas technisch; in der Tat so technisch, dass sie es nur skizzieren. Ich versuchte einen elementareren Beweis mit der Perron-Frobenius-Theorie. Wir können den Übergangsgraphen des DFA als einen Digraphen betrachten. Wenn der Digraph primitiv ist, folgt das Ergebnis fast direkt aus dem Perron-Frobenius-Theorem. Wenn der Digraph irreduzibel ist, aber nicht den Index , erhalten wir unter Berücksichtigung der " r- ten Potenz" des DFA (jeder Übergang entspricht r- Symbolen) dasselbe Ergebnis. Der schwierige Fall ist, wenn der Digraph reduzierbar ist. Wir können auf den Fall eines Pfades stark verbundener Komponenten reduzieren und erhalten dann das Ergebnis, indem wir Summen der Form m 1 + schätzen rrr (Jede solche Summe entspricht einer bestimmten Art und Weise, ein Wort zu akzeptieren, wobei die verschiedenen Komponenten auf eine bestimmte Art und Weise durchlaufen werden.) Diese Summe kann wiederum geschätzt werden, indem der größte Term bestimmt wird, dermilogλi entspricht. Für jeden Eigenwert, derr-malwiederholtwird, erhalten wir einen zusätzlichen Faktor vonΘ(m r - 1 ).

m1++mk=mich=1kλichmich.
michLogλichrΘ(mr-1)

Der Beweis hat seine Ecken und Kanten: in dem reduzierbaren Fall müssen wir von Begriffen asymptotischen passieren die Summe oben erwähnt, und dann müssen wir die Summe abzuschätzen.Cλichm

Der Beweis von Flajolet und Sedgewick ist vielleicht einfacher, aber weniger elementar. Ausgangspunkt ist die rationale Erzeugungsfunktion von , bei der die Anzahl der Polgrößen (!) Induziert wird. Die Grundidee ist, dass alle Eigenwerte des Maximalmoduls aufgrund eines (mäßig einfachen) Satzes von Berstel Wurzeln der Einheit sind (wenn durch ihren Modul normalisiert). Wenn Sie ein geeignetes d auswählen und Wörter mit der Länge d m + a betrachten , werden alle diese Eigenwerte real. Unter Berücksichtigung der Teilbruchexpansion erhalten wir, dass, wenn der Eigenwert des Maximalmoduls "überlebt", er die Asymptoten bestimmt, die die Form C n k habencn(L)ddm+ein . Andernfalls finden wir eine neue rationale Erzeugungsfunktion, die nur Wörtern dieser Länge entspricht (unter Verwendung eines Hadamard-Produkts), und wiederholen das Argument. Die vorgenannte Menge nimmt ständig ab, und so finden wir schließlich die gewünschten Asymptoten; Es kann sein, dass d dabei wachsen muss, um alles zu reflektieren, was in den induktiven Schritten passiert.Cnkλnd

Gibt es einen einfachen und elementaren Beweis für die asymptotische Eigenschaft von ?cn(L)

Yuval Filmus
quelle
Auf welche "asymptotische Eigenschaft" beziehen Sie sich, die ganz oben?
Raphael
Genau diese Eigenschaft.
Yuval Filmus
Gibt es für den reduzierbaren Fall keine einfachen kombinatorischen Grenzen (möglicherweise erhalten durch Berücksichtigen von Teilmengen von Pfaden und von Mehrfachmengen von Pfaden)?
András Salamon
Es gibt einfache Grenzen, aber Sie verlieren dort wahrscheinlich Polynomfaktoren. Es gibt eine Summe mit polynomiell vielen Begriffen, und wir können sie unter Verwendung des größten Begriffs schätzen. Dies gibt uns jedoch nicht die richtige Asymptotik, da die anderen Ausdrücke ziemlich schnell verfallen. Vielleicht ist eine Schätzung mit einem Integral möglich, aber das wird schon ein bisschen chaotisch.
Yuval Filmus
1
Im Allgemeinen kann es sehr schwierig sein, alternative oder elementarere Beweise für Probleme zu finden. Dies ist meist eine theoretische Übung. Gibt es weitere Motivation / bkg / Anwendung? Schlagen Sie vor, nach cstheory zu migrieren.
vzn

Antworten:

3

Das von Ihnen skizzierte Argument scheint im Einklang mit Richard Stanleys Behandlung der Transfer-Matrix-Methode in Enumerative Combinatorics, Band 1 (Link: S. 573; Druck: S. 500) zu stehen.

Er beginnt mit der Erzeugungsfunktion und packt sie unter Berücksichtigung von Digraphen und zulässigen und verbotenen Faktoren aus. Anschließend abstrahiert er zu freien Monoiden, wobei er eine verfeinerte Version der von Ihnen angegebenen Beträge verwendet, um Folgendes zu beweisen:

4.7.11 Satz Sei eine Teilmenge von A , die frei B erzeugt . Dann ist B ( λ ) = ( I - B ( λ ) ) - 1BABB(λ)=(ich-B(λ))-1

Nachdem er einige Anwendungen durchgearbeitet hat, schließt er den Abschnitt ebenfalls mit der Diskussion von Hadamard-Produkten in Bezug auf horizontal konvexe Polyominoe.

JSS
quelle
Können Sie auf einen Satz in Stanleys Text verweisen, der asymptotische Schätzungen enthält?
Yuval Filmus
Ich kann in Stanley keine unmittelbare, explizite Referenz finden, aber Flajolet und Sedgewick erkennen seinen Einfluss auf ihre Behandlung der Übertragungsmatrixmethode in Abschnitt V.6 an. Insbesondere werden in Korollar V.1 frühere Theoreme (V.7, V.8) zusammengefasst, die Ihrer Argumentation zu folgen scheinen. Sie scheinen auch Stanleys Umriss zu folgen, der in Unterabschnitt V.5 beginnt, wo Satz V.6 Stanleys Satz 4.7.2 und Folgerung 4.7.3
JSS
Was ich speziell suche, ist asymptotische Analyse. Die genaue Formel für die Anzahl der Wörter mit der angegebenen Länge nach der Übertragungsmatrixmethode ist für mich selbstverständlich.
Yuval Filmus