Dieser reguläre Ausdruck repräsentiert eine Markov-Kette in Zuständen, die einem Startzustand und jedem der Buchstaben entsprechen. Ein Übergang erfolgt von nach , von nach , ... und vom vorletzten Buchstaben zum letzten, immer mit der Wahrscheinlichkeit . Ansonsten bleibt der Zustand gleich. Der Endzustand ist ein absorbierender Zustand: Wenn er erreicht wurde, wurden alle Buchstaben nacheinander beobachtet.m+1ssaabp
In Bezug auf die Zustände ist die Übergangsmatrix(s,a,b,…)
Pm=⎛⎝⎜⎜⎜⎜⎜⎜⎜1−p0⋮00p1−p0⋯00p⋱0⋯⋯⋯p1−p000⋮p1⎞⎠⎟⎟⎟⎟⎟⎟⎟
Standardmäßige lineare algebraische Techniken (die jordanische Normalform von und ihre Änderung der Basismatrix sind einfach und spärlich, was dies ziemlich einfach macht) legen fest, dass für der letzte Eintrag in der ersten Zeile des Matrixleistung istPmn≥mPnm
Pnm(1,m+1)=pm∑i=0n−m(m−1+im−1)(1−p)i.
Dies ist die Chance, nach Übergängen vom Startzustand aus den absorbierenden Zustand zu erreichen : Sie beantwortet die Frage. Wenn Sie möchten, kann es in "geschlossener Form" in Form einer hypergeometrischen Funktion als ausgedrückt werdenn
Pnm(1,m+1)=1−pm(nm−1)(1−p)−m+n+12F1(1,n+1;n+2−m;1−p).
Die Summe hat eine angenehme kombinatorische Interpretation. Sei die Position, an der der letzte Buchstabe zuerst auftritt. Es wird durch eine (möglicherweise leere) Folge von nicht - voraus s, jeweils mit einer Chance auftritt; dann ein mit einer Chance auftritt; dann eine (möglicherweise nicht leere) Folge von Nicht- usw. Es gibt Stellen, an denen das erste Auftreten eines und dann das erste Auftreten von platziert werden kann a danach usw. Somit ist - einschließlich des ersten Auftretens des letzten Buchstabens in Position - die Wahrscheinlichkeitm+ia1−papb(m−1+im−1)abm+i(m−1+im−1)pm(1−p)k . Dies ergibt einen Term der Summe. Somit zerlegt die Summe die Sequenzen danach, wo der letzte Buchstabe zuerst auftritt, was irgendwo von Position bis liegen kann - diese sind offensichtlich disjunkt - und addiert ihre Wahrscheinlichkeiten.m+0m+(n−m)
Nehmen Sie als einfaches Beispiel zur Verdeutlichung der Interpretation und betrachten Sie . Es gibt vier Folgen von drei Symbolen mit der Wahrscheinlichkeit und drei weitere Folgen der Wahrscheinlichkeit , in denen die Symbole und der Reihe nach erscheinen:m=2n=3p3p2(1−2p)ab
aab,aba,abb,bab;ab$,a$b,$ab.
Die Chance ist also
4p3+3p2(1−2p)=3p2−2p3=p2(3−2p)=p2(1+2(1−p))=P32(1,3).
Die kombinatorische Interpretation ist, dass der reguläre Ausdruck ^ab
(mit in Position ) mit der Wahrscheinlichkeit auftritt ; und mit in Position tritt es auf zwei Arten als und mit der Wahrscheinlichkeit .b2p2^[^a]*a[^b]*b
b3^a[^b]b
^[^a]ab
p2(1−p)