Wie hoch ist bei zwei absorbierenden Markov-Ketten die Wahrscheinlichkeit, dass eine vor der anderen endet?

9

Ich habe zwei verschiedene Markov-Ketten mit jeweils einem absorbierenden Zustand und einer bekannten Ausgangsposition. Ich möchte die Wahrscheinlichkeit bestimmen, dass Kette 1 in weniger Schritten einen absorbierenden Zustand erreicht als Kette 2.

Ich denke, ich kann die Wahrscheinlichkeit berechnen, nach n Schritten einen absorbierenden Zustand in einer bestimmten Kette zu erreichen: Bei einer Übergangsmatrix beträgt die Wahrscheinlichkeit, nach Schritten absorbiert zu werden, wobei der Startzustand und ist absorbierender Zustand.n P n i j i jP.nP.ichjnichj

Ich bin mir allerdings nicht sicher, wohin ich von hier aus gehen soll. Analoge Probleme, die ich gesehen habe, betreffen Würfel (z. B. das Würfeln einer Summe von 7 vor einer Summe von 8), aber das ist einfacher zu lösen, da die Wahrscheinlichkeit, eine bestimmte Summe zu würfeln, konstant und unabhängig von der Anzahl der bisher unternommenen Schritte ist.

Jeff
quelle

Antworten:

13

Führen Sie die Ketten parallel. Definieren Sie drei Absorptionszustände in der resultierenden Produktkette:

  1. Die erste Kette erreicht einen absorbierenden Zustand, die zweite jedoch nicht.

  2. Die zweite Kette erreicht einen absorbierenden Zustand, die erste jedoch nicht.

  3. Beide Ketten erreichen gleichzeitig einen absorbierenden Zustand.

Die begrenzenden Wahrscheinlichkeiten dieser drei Zustände in der Produktkette geben die Chancen von Interesse.


Diese Lösung beinhaltet einige (einfache) Konstruktionen. Wie in der Frage sei eine Übergangsmatrix für eine Kette P.P.=P.ichj,1ich,jnP. . Wenn sich die Kette im Zustand , gibt P i j die Wahrscheinlichkeit eines Übergangs in den Zustand j an . Ein absorbierender Zustand geht mit Wahrscheinlichkeit 1 zu sich selbst über .ichP.ichjj1

  1. Jeder Zustand kann absorbiert werden, wenn die Zeile P i = ( P i j , j = 1 , 2 , , n ) durch einen Indikatorvektor ( 0 , 0 , …) ersetzt wird.ichP.ich=(P.ichj,j=1,2,,n) mit einer 1 in Position i .(0,0,,0,1,0,,0)1ich
  2. Jede Menge absorbierender Zustände kann zusammengeführt werden, indem eine neue Kette P / A erstellt wird, deren Zustände { i sindEINP./.EIN . Die Übergangsmatrix ist gegeben durch{ich|ichEIN}}{EIN}}

    (P./.EIN)ichj={P.ichjichEIN,jEINkEINP.ichkichEIN,j=EIN0ich=EIN,jEIN1ich=j=EIN.

    Dies läuft darauf hinaus, die Spalten von , die A entsprechen, zu summieren und die Zeilen, die A entsprechen, durch eine einzelne Zeile zu ersetzen, die zu sich selbst übergeht.P.EINEIN

  3. Das Produkt zweier Ketten in den Zuständen S P und Q in den Zuständen S Q mit den Übergangsmatrizen P bzw. Q ist eine Markov-Kette in den Zuständen S P × S Q = { ( p , q )P.S.P.Q.S.Q.P.Q. mit ÜbergangsmatrixS.P.×S.Q.={(p,q)|pS.P.,qS.Q.}}

    (P.Q.)(ich,j),(k,l)=P.ichkQ.jl.

    Tatsächlich führt die Produktkette die beiden Ketten parallel aus, verfolgt getrennt, wo sich jede befindet, und führt unabhängig voneinander Übergänge durch.


Ein einfaches Beispiel kann diese Konstruktionen verdeutlichen. Angenommen Polly eine Münze mit einer Chance ist Flipping Landeköpfe. Sie plant dies, bis sie einen Kopf beobachtet. Die Zustände für den Münzwurfprozess sind S P = { T , H }pS.P.={T.,H.}} was die Ergebnisse des letzten Wurfs darstellt: für Schwänze, H für Köpfe. Durch die Planung, an den Köpfen anzuhalten, wird Polly die erste Konstruktion anwenden, indem H zu einem absorbierenden Zustand gemacht wird. Die resultierende Übergangsmatrix istT.H.H.

P.=(1- -pp01).

Es beginnt in einem zufälligen Zustand , der durch den ersten Wurf gegeben wird.(1- -p,p)

Pünktlich zu Polly wird Quincy eine faire Münze werfen. Er will aufhören, sobald er zwei Köpfe hintereinander sieht. Seine Markov-Kette muss daher sowohl das vorhergehende als auch das aktuelle Ergebnis verfolgen. Es gibt vier solcher Kombinationen von zwei Köpfen und zwei Schwänzen, die ich zum Beispiel als " " abkürzen werde , wobei der erste Buchstabe das vorherige Ergebnis und der zweite Buchstabe das aktuelle Ergebnis ist. Quincy wendet Konstruktion (1) an, um zu machenTH einem absorbierenden Zustand. Danach stellt er fest, dass er nicht wirklich vier Zustände benötigt: Er kann seine Kette auf drei Zustände vereinfachen: T bedeutet, dass das aktuelle Ergebnis Schwänze ist, H bedeutet, dass das aktuelle Ergebnis Köpfe ist, und X.HHT.H.X.bedeutet, dass die letzten beiden Ergebnisse beide Köpfe waren - dies ist der absorbierende Zustand. Die Übergangsmatrix ist

Q.=(1212012012001).

Die Produktkette läuft in sechs Zuständen: . Die Übergangsmatrix ist einTensorproduktvon P und Q und ebenso einfach zu berechnen. Zum Beispiel ( T ) , ( T , H.(T.,T.),(T.,H.),(T.,X.);;(H.,T.),(H.,H.),(H.,X.)P.Q. ist die Chance, dass Polly einen Übergang vonTnachT machtund Quincy gleichzeitig (und unabhängig) einen Übergang vonTnachH macht. Die erstere hat eine Chance von1-pund die letztere eine Chance von1 / 2. Da die Ketten unabhängig voneinander laufen, multiplizieren sich diese Chancen und ergeben(1-p) / 2. Die vollständige Übergangsmatrix ist(P.Q.)(T.,T.),(T.,H.)T.T.T.H.1- -p1/.2(1- -p)/.2

P.Q.=(1- -p21- -p20p2p201- -p201- -p2p20p2001- -p00p0001212000012012000001).

Es liegt in Blockmatrixform mit Blöcken vor, die der zweiten Matrix :Q.

P.Q.=(P.11Q.P.12Q.P.21Q.P.22Q.)=((1- -p)Q.pQ.0Q.).

Polly und Quincy konkurrieren darum, wer zuerst ihr Ziel erreicht. Der Gewinner ist Polly, wenn zuerst ein Übergang zu wobei * nicht X ist . Der Gewinner ist Quincy, wenn zum ersten Mal ein Übergang zu ( T , X ) erfolgt . und wenn bevor einer dieser Fälle eintreten kann, ein Übergang zu ( H , X ) erfolgt , ist das Ergebnis ein Unentschieden. Um den Überblick zu behalten, werden wir die Zustände ( H , T ) und ( H , H ) erstellen. beide absorbiert (über die Konstruktion (1)) und sie dann zusammenführt (über die Konstruktion (2)). Die resultierende Übergangsmatrix, geordnet nach den Zuständen ( T , T.(H.,* *)* *X.(T.,X.)(H.,X.)(H.,T.)(H.,H.) ist(T.,T.),(T.,H.),(T.,X.),{(H.,T.),(H.,H.)}},(H.,X.)

R.=(1- -p21- -p20p01- -p201- -p2p2p2001000001000001).

(T.,T.),(T.,H.),(T.,X.),{(H.,T.),(H.,H.)}},(H.,X.)μ=((1- -p)/.2,(1- -p)/.2,0,p,0)

n

μR.n11+4p- -p2(0,0,(1- -p)2,p(5- -p),p(1- -p)).

(T.,X.),{(H.,T.),(H.,H.)}},(H.,X.)(1p)2:p(5p):p(1p)

Zahl

Als Funktion von p

whuber
quelle
1
Sehr ordentliches Beispiel, danke dafür. Ich arbeite immer noch an den Details, um sie selbst zu sehen. Nur eine Frage: Hier haben wir angenommen, dass die beiden Ereignisse (Polly- und Quincy-Würfe) gleichzeitig stattfinden. Wie viel Unterschied würde es machen, wenn wir sie sequentiell machen oder jedes Mal zufällig auswählen, wer als nächstes wirft?
user929304
1
@ user929304 Sie würden unterschiedliche Antworten erhalten, möglicherweise im Wesentlichen. Angenommen, P und Q führen eine Kette, in der die Zustände in Teilmengen A und B unterteilt sind, in denen alle Übergänge von A nach B und alle von B nach A gehen. Lassen Sie P und Q beide bei Zuständen in A beginnen In der Produktkette wechseln beide gleichzeitig zwischen A und B, aber die Ketten mit sequentieller und zufälliger Auswahl unterbrechen dieses invariante Muster.
whuber