Ich habe eine empirische Übergangszählmatrix Q. Ich habe eine theoretische Markov-Kette erster Ordnung P. Sagen wir, N ist die Anzahl der Übergänge. Ich möchte testen, ob Q mit P kompatibel ist. Ist es richtig, die theoretische Zählübergangsmatrix (N * P) zu finden, die die Chi-Quadrat-Statistik berechnet? und dann Berechnung des p-Wertes einer-Verteilung mitFreiheitsgraden?
hypothesis-testing
chi-squared
markov-process
Giorgio Spedicato
quelle
quelle
Antworten:
ipi=P i , :
Ich bin nicht sicher, ob Sie alle Zeilen zusammenfassen können, da die "Anzahl der Versuche" zwischen den Zeilen variiert.
Sagen Sie zum Beispiel und Ihre Daten sind . Es gibt also Übergänge, wobei von , aber von und nur und von . Daher würde ich denken, dass Ihr Vertrauen in im Allgemeinen höher sein sollte als Ihr Vertrauen in .x = [ 1 , 1 , 2 , 1 , 2 , 3 , 1 , 2 ] N = 7 n 1 = 4 x = 1 n 2 = 2 x = 2 n 3 = 1 x = 3 p 1 p 3K=3 x=[1,1,2,1,2,3,1,2] N=7 n1=4 x=1 n2=2 x=2 n3=1 x=3 p^1 p^3
(Im Extremfall war für dieses Beispiel vielleicht tatsächlich , aber Sie haben überhaupt keine Daten zu diesen Übergängen, da Behandlung von "Abwesenheit von Beweisen als Beweis für Abwesenheit" erscheint mir hier problematisch.)4 n 4 = 0K 4 n4=0
Ich bin mit Chi-Quadrat-Tests nicht sehr vertraut, aber dies legt nahe, dass Sie die Zeilen möglicherweise unabhängig behandeln möchten (dh nur über summieren und anstelle von ). Diese Argumentation scheint nicht spezifisch für den Chi-Quadrat-Test zu sein, sollte also auch für jeden anderen Signifikanztest gelten, den Sie möglicherweise verwenden (z . B. genaues Multinomial ).n i N.j ni N
Das Hauptproblem besteht darin, dass die Übergangswahrscheinlichkeiten bedingt sind , sodass für jeden Matrixeintrag nur die Übergänge relevant sind, die seine Vorbedingung erfüllen. Vermutlich erfüllt die Übergangsmatrix vermutlich , daher sollte die "empirische Übergangsmatrix" .∑jPij=1 P^ij=Qij/ni
Update: Als Antwort auf die Anfrage von OP eine Klarstellung der "Testparameter".
Wenn es Zustände in der Markov-Kette gibt, dh , dann hat die entsprechende Multinomialverteilung für Zeile den Wahrscheinlichkeitsvektor und Anzahl der Versuche , wie oben angegeben.K P∈RK×K i pi∈RK ni∈N
Es wird also Kategorien geben, und der Wahrscheinlichkeitsvektor wird Freiheitsgrade haben, als . Für Zeile die entsprechende Statistik was asymptotisch sein wird Folgen Sie einem Chi-Quadrat, das mit Freiheitsgraden verteilt ist (wie hier und hier angegeben ). Siehe auch hier für eine Diskussion darüber, wann der Test angemessen ist, und für alternative Tests, die möglicherweise geeigneter sind.K pi K−1 ∑Kj=1(pi)j=1 i χ2
Es kann möglich sein, einen "konzentrierten Test" durchzuführen, vorausgesetzt, folgt einer Chi-Quadrat-Verteilung mit -Dofs (dh Summieren von Dofs über Zeilen). Ich bin mir jedoch nicht sicher, ob das als unabhängig behandelt werden kann. In jedem Fall scheinen die zeilenweisen Tests informativer zu sein, weshalb sie einem konzentrierten Test vorzuziehen sind.χ2P=∑iχ2i K(K−1) χ2i
quelle