Ich vermute, dass eine Reihe von beobachteten Sequenzen eine Markov-Kette sind ...
X=⎛⎝⎜⎜⎜⎜AB⋮BCA⋮CDA⋮ADC⋮DBA⋮AAD⋮BCA⋮E⎞⎠⎟⎟⎟⎟
Wie kann ich jedoch überprüfen, ob sie tatsächlich die memorylose Eigenschaft von respektieren
P(Xi=xi|Xj=xj)?
Oder zumindest beweisen, dass sie Markov in der Natur sind? Beachten Sie, dass dies empirisch beobachtete Sequenzen sind. Irgendwelche Gedanken?
BEARBEITEN
Um nur hinzuzufügen, das Ziel ist es, einen vorhergesagten Satz von Sequenzen mit den beobachteten zu vergleichen. Wir würden uns daher über Kommentare freuen, wie diese am besten verglichen werden können.
Übergangsmatrix erster Ordnung Mij=xij∑mxik
wobei m = A..E ist
M=⎛⎝⎜⎜⎜⎜⎜⎜0.18340.46970.18270.23780.24580.30770.11360.24040.18180.17880.07690.00760.22120.06290.11730.14790.25000.19230.33570.17880.28400.15910.16350.18180.2793⎞⎠⎟⎟⎟⎟⎟⎟
Eigenwerte von
E=⎛⎝⎜⎜⎜⎜⎜⎜1.000000000−0.2283000000.1344000000.1136−0.0430i000000.1136+0.0430i⎞⎠⎟⎟⎟⎟⎟⎟
Eigenvektoren von M
V=⎛⎝⎜⎜⎜⎜⎜⎜0.44720.44720.44720.44720.4472−0.58520.7838−0.2006−0.00100.0540−0.4219−0.42110.37250.70890.0589−0.2343−0.0421i−0.4479−0.2723i0.63230.2123−0.0908i0.2546+0.3881i−0.2343+0.0421i−0.4479+0.2723i0.63230.2123+0.0908i0.2546−0.3881i⎞⎠⎟⎟⎟⎟⎟⎟
Antworten:
Ich frage mich, ob das Folgende einen gültigen Pearson Test für die folgenden Proportionen ergeben würde.χ2
quelle
Die Markov-Eigenschaft ist möglicherweise nur schwer direkt zu testen. Es kann jedoch ausreichend sein, ein Modell anzupassen, das die Markov-Eigenschaft annimmt, und dann zu testen, ob das Modell gültig ist. Es kann sich herausstellen, dass das angepasste Modell eine gute Annäherung ist, die für Sie in der Praxis nützlich ist, und Sie müssen sich keine Sorgen machen, ob die Markov-Eigenschaft tatsächlich gilt oder nicht.
Die Parallele kann zur linearen Regression gezogen werden. In der Regel wird nicht geprüft, ob die Linearität gilt, sondern ob das lineare Modell eine nützliche Annäherung darstellt.
quelle
Um den Vorschlag der vorherigen Antwort zu konkretisieren, möchten Sie zunächst die Markov-Wahrscheinlichkeiten abschätzen - vorausgesetzt, es handelt sich um Markov. Siehe die Antwort hier Schätzen der Markov-Kettenwahrscheinlichkeiten
Eine andere Möglichkeit wäre zu sehen, ob die Proportionen des Grundzustands: die in A verbrachte Proportionszeit, die in B verbrachte Zeit, mit dem Eigenvektor des Einheitseigenwerts von M übereinstimmen Staat sollte zu dieser Grenze neigen.
quelle
apply
sweep
Der Junge. 5 des Buches Die statistische Analyse stochastischer Prozesse in der Zeit von JK Lindsey enthält andere Ideen zur Überprüfung von Annahmen.
]
quelle
Ich denke, Placida und Mpiktas haben beide sehr nachdenkliche und ausgezeichnete Ansätze gegeben.
Ich antworte, weil ich nur hinzufügen möchte, dass man einen Test erstellen könnte, um zu sehen, obP( Xich= x | Xi - 1= y) unterscheidet sich von P( Xich= x | Xi - 1= y und Xi - 2= z) .
Ich würde Werte für auswählenx , y und z für die es eine große Anzahl von Fällen gibt, in denen der Übergang von z zu y zu x tritt ein. Berechnen Sie Stichprobenschätzungen für beide Wahrscheinlichkeiten. Testen Sie dann die Proportionen. Der schwierige Aspekt dabei ist, die Varianzen der beiden Schätzungen unter der Nullhypothese zu ermitteln, die besagen, dass die Proportionen gleich sind und die Kette stationär und Markov ist. Wenn wir in diesem Fall unter der Nullhypothese nur alle 2-Stufen-Übergänge betrachten und sie mit ihren entsprechenden 3-Stufen-Übergängen vergleichen, aber nur Ergebnisse einschließen, bei denen diese gepaarten Ergebnissätze um mindestens 2 Zeitpunkte voneinander getrennt sind, dann ist die Folge der gemeinsamen Ergebnisse wo Erfolg ist definiert alsz zu y zu x Übergang und alle anderen zweistufigen Übergänge zu x als Misserfolge repräsentieren eine Reihe von unabhängigen Bernoulli-Versuchen unter der Nullhypothese. Dasselbe würde für die Definition aller funktioniereny zu x Übergänge als Erfolge und andere einstufige Übergänge zu x als Fehlschläge.
Then the test statistic would be the difference between these estimated proportions. The complication to the standard comparison of the Bernoulli sequences is that they are correlated. But you could do a bootstrap test of binomial proportions in this case.
The other possibility is to construct a two by two table of the two stage and three stage paired outcomes where0 is failure and 1 is success and the cell frequencies are counts for the pairs (0,0) , (0,1) , (1,0) and (1,1) where the first component is the two stage outcome and the second is the corresponding three stage outcome. You can then apply McNemar's test to the table.
quelle
You could bin the data into evenly spaced intervals, then compute the unbiased sample variances of subsets{Xn+1:Xn=x1,Xn−k=x2} . By the law of total variance,
The LHS, if it is almost zero, provides evidence that the transition probabilities do not depend onXn−k , though it is clearly a weaker statement: e.g., let Xn+1∼N(Xn,Xn−1) . Taking the expected value of both sides of the above equation, the RHS can be computed from the sample variances (i.e., replacing expected values with averages). If the expected value of the variance is zero then the variance is 0 almost always.
quelle