Was ist eine Formel für die Anzahl der Zeichenfolgen ohne Wiederholungen?

8

Ich mag die Anzahl der Saiten zählen s über ein endliches Alphabet , die keine Wiederholungen enthalten, und dass ich für jede Teilkette bedeuten von ,gibt es keine disjunkte Kopie von in . Zum Beispiel sei . Dann ist eine der Saiten , die ich zählen möchten, da für die Teilzeichen , es gibt keine Kopien disjunkt sind. Allerdings enthält eine solche Wiederholung.Ats1<|t|<|s|tsA={a,b}aaa aaabab

Wenn jemand bereits eine nützliche Formel gefunden hat, verlinken Sie bitte. Andernfalls werde ich in jedem Artikel, den ich schreibe, auf diesen Beitrag zurückgreifen, wenn ich die Antwort von jemandem verwende.

Hier ist ein weiteres Beispiel. Versuchen wir, eine lange Zeichenfolge über , die keine Wiederholungen enthält:{a,b}

aaa (kann nicht a sein)
   aaab (a oder b)
     aaabbb (kann nicht b sein)
       aaabbba (kann nicht b oder a sein)
   aaaba (kann nicht a oder b sein)

Wenn wir einen Baum bauen würden, könnten wir die Anzahl der Knoten zählen, aber ich möchte eine Formel.

Bearbeiten: Nun, es ist nicht so entmutigend, wie ich zuerst dachte, wenn wir dies in ein Problem bei der Auswahl von Behältern umwandeln. Eine Menge von Zeichenketten der Länge k mit mindestens einer Wiederholung ist gleich der Menge, die die Vereinigung aller Permutationen des kartesischen Produkts darstellt: wobei die erforderliche Wiederholung ist. Ich weiß nicht, ob das hilfreich ist, aber es klang pro :) Wie auch immer, lass sie | A | sein Bins, wählen Sie zwei beliebige (auch wenn das gleiche) als Wiederholung, wählen Sie dann mehr und multiplizieren Sie (die ersten 4 sind bereits ausgewählt, siehe?). Jetzt muss ich nur noch diese Formel aus der diskreten Mathematik finden.A×A××A(k-4 times)×R×RRk4

Dan Donnelly
quelle
1
Warum gibt es in keine disjunkte Kopie ? ist nichtaaa ein gültiger Teilstring von s = a a ,dh s = t t ? Können Sie noch ein paar Beispiele nennen, um zu klären, was zählen soll und was nicht? t=as=aas=tt
Ran G.
1
Hinweis Anforderung. Lassen Sie mich wissen, ob / wie ich meinen Beitrag klarer schreiben kann. 1<|t|
Dan Donnelly
Ja, ich habe diese Anforderung verpasst. Es macht jetzt mehr Sinn.
Ran G.
1
Ich sehe nicht, wie Sie (zum Beispiel mit einem 2-Buchstaben-Alphabet) eine Zeichenfolge mit der Länge (sagen wir) 10 ohne Wiederholungen erstellen können. dh die gewünschte Zahl muss durch eine Funktion von k unabhängig von n
Suresh am
2
Ich kann nur sagen, dass für ein Alphabet der Größe längste mögliche Zeichenfolge ohne Wiederholungen 2 ( n) istn3nliegt daran, dass Sie eine Zeichenfolge der Länge3mit denselben Elementen und2 ( n) haben können
2(n2)+3n
3n3 liegt daran, dass Sie nur2⋅ haben ( n2(n2) unterschiedliche Kombination dieser Elemente und Hinzufügen neuer Kombinationsursachen zur Wiederholung. (Ich dachte, dass Sie über disjunkte Wiederholungen sagen). 2(n2)

Antworten:

1

Dies beantwortet die Frage nach der Anzahl der wiederholungsfreien Wörter pro Größe, was bedeutet, dass die gewünschte Menge überhaupt existiert.

Definition: Anruf Wiederholung frei , wenn und nur wenn es keinen Faktor enthält x y x mit x & egr ; & Sgr; & ge ; 2 und y & egr ; & Sgr; * .wΣ xyxxΣ2yΣ

Behauptung: Für gegebenes endliches Alphabet mit | Σ | = k , es gibt keine wiederholungsfreien Wörter mit einer Länge von mehr als 2 k 2 + 1 .Σ|Σ|=k2k2+1

Beweisidee: Nach dem Pigeon-Hole-Prinzip. Nehmen Sie ein Wort der Länge 2 k 2 + 2 (oder ein längeres Wort und betrachten Sie dessen Präfix dieser Länge), dh w = a 0 a ' 0a k 2 a ' k 2 . Angenommen, w ist wiederholungsfrei; das bedeutet, dass a i a ' ia j a ' j für alle i j ist (ansonsten hatten wir eine Wiederholung). Daher gibt es kw2k2+2w=a0a0ak2ak2waiaiajajij viele Symbolpaare; dies widerspricht | Σ 2 | = k 2 . So w ist nicht wiederholen frei. k2+1|Σ2|=k2w

Beachten Sie, dass dies ein grober Beweis ist: Die Faktoren können noch früher zu einer Wiederholung führen.aiai+1


Notation:

  • Σk=i=kΣi=Σi=0k1Σi
  • "factor" = "subword" = "substring"
Raphael
quelle
Dies beantwortet die Frage nicht wirklich. Sie haben nur eine sehr grobe und ziemlich offensichtliche Obergrenze bewiesen, die Frage nach einer genauen Formel.
Gilles 'SO - hör auf böse zu sein'
@ Gilles: Ich habe die Frage zuerst falsch verstanden, dachte aber, ich könnte das, was ich hier geschrieben habe, anderen überlassen (z. B. Kaveh, der behauptete, es gäbe unendlich viele solcher Wörter).
Raphael
Mein Kommentar ist enger als Ihre Antwort.