So testen Sie, ob der „vorherige Zustand“ Einfluss auf den „nachfolgenden Zustand“ in R hat

10

Stellen Sie sich eine Situation vor: Wir haben historische Aufzeichnungen (20 Jahre) von drei Minen. Erhöht das Vorhandensein von Silber die Wahrscheinlichkeit, im nächsten Jahr Gold zu finden? Wie teste ich eine solche Frage?


Geben Sie hier die Bildbeschreibung ein

Hier sind Beispieldaten:

mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
            "rock","rock","rock","rock","silver","rock","rock",
            "rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
            "silver","gold","gold","gold","gold","gold","rock",
            "silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
            "rock","silver","rock","rock","rock","rock","silver",
            "gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)

Ladislav Naďo
quelle
1
Möglicherweise möchten Sie Übergangsmatrizen berechnen .
Andy W
Hallo @AndyW! Danke für deinen Kommentar. Ich bin mit dem Übergangsmatrizenpaket vertraut: makkovchain - markovchainFit (). Darf ich die Wahrscheinlichkeitswerte aus der Übergangsmatrix als p-Werte verwenden? Gibt es eine Möglichkeit, die Hypothese zu testen: "Es gibt eine" Silber-Gold "-Beziehung." (p-Wert = xx)?
Ladislav Naďo
1
@ LatislavNado-Übergangswahrscheinlichkeiten können nicht als p-Werte interpretiert werden (sie sagen nichts über das Ablehnen von H0 aus). Weitere Informationen zu p-Werten finden Sie unter stats.stackexchange.com/questions/31/… .
Tim
1
Ich sehe ein Problem mit der Art und Weise, wie Sie Ihre Daten extrahiert haben. Betrachten Sie Ihr Szenario "Silber: Nein" und "Gold: Ja". Sie sollten auch Ihre aufeinander folgenden "Gold" -Läufe zählen, da dies die logischen Kriterien erfüllt.
1
Wenn die eine Zelle von 1 auf 14 korrigiert ist, ändert sich das Modell zu: Koeffizienten: Schätzung Std. Fehler z Wert Pr (> | z |) (Achsenabschnitt) -1,2528 0,8018 -1,562 0,118 als Faktor (c (0, 1)) 1 0,3655 0,8624 0,424 0,672

Antworten:

4

Mein bester Versuch: ... Die Verwendung der von @AndyW vorgeschlagenen Übergangsmatrizen ist wahrscheinlich nicht die Lösung, nach der ich suche (basierend auf dem Kommentar von @ Tim). Also habe ich einen anderen Ansatz versucht. Ich habe diesen Link gefunden, der sich mit der logistischen Regression befasst, bei der die Antwortvariable y und eine Prädiktorvariable x beide binär sind .

Gemäß Beispiel sollte ich basierend auf meinen Daten eine 2 × 2-Tabelle erstellen:

               gold (yes)  gold (no)
silver (yes)       2           7
silver (no)       14          34

Wie ich die Werte extrahiert habe: Geben Sie hier die Bildbeschreibung ein

Und konstruiere ein Modell:

response <- cbind(yes = c(2, 14), no = c(7, 34))

mine.logistic <- glm(response ~ as.factor(c(0,1)),
                      family = binomial(link=logit))

summary(mine.logistic)
# Coefficients:
#                     Estimate Std. Error z value Pr(>|z|)
# (Intercept)          -1.2528     0.8018  -1.562    0.118
# as.factor(c(0, 1))1   0.3655     0.8624   0.424    0.672

Ist es eine gute Lösung? Bedeutet der p-Wert (0,673), dass das Vorhandensein von Silber die Wahrscheinlichkeit, Gold zu finden, nicht erhöht?

Ladislav Naďo
quelle
Wie haben Sie diese schönen Diagramme erstellt? Tikz?
Shadowtalker
Hallo @ssdecontrol! Die Diagramme wurden in Inkscape von Hand erstellt.
Ladislav Naďo
Ja, das ist eine anständige Interpretation. Wenn Sie sich nur die Zeilen Ihrer 2x2-Tabelle ansehen, haben Sie in der obersten Zeile (Silber: Ja) 9 Fälle, von denen 2 Gold hatten. Die Silberwahrscheinlichkeit für Gold im nächsten Jahr beträgt also 2/9 = 0,222. In der unteren Reihe (Silber: Nein) haben Sie 48 Fälle, von denen 14 im nächsten Jahr Gold hatten. Wenn also keine Silberwahrscheinlichkeit für Gold vorliegt, beträgt 14 / (14 + 34) = 0,292. In Anbetracht all das, es sieht aus wie Silber schmerzt Ihre Chance , Gold zu finden, wenn auch aus Ihren p-Werten nicht „statistisch signifikant“.
Gregor Thomas
Denken Sie auch an Ihre Codierung, mit der Sie beginnen yes = c(2, 14), no = c(7, 34), was bedeutet, dass Sie Silber setzen: Ja zuerst. Wenn Sie dies tun, entspricht as.factor(c(0, 1))die 0 Silber: Ja, das ist Ihr Referenzpegel und damit Ihr Achsenabschnitt. Der p-Wert von 0,67 entspricht dem kleinen positiven Anstieg, den Sie bei der Wahrscheinlichkeit erhalten, dass sich Gold von Silber zu Silber bewegt: Ja zu Silber: Nein.
Gregor Thomas
Eine letzte Bemerkung: Sie sind mit Übergangsmatrizes. Ihre 2, 7, 14, 34-Matrix ist eine Übergangsmatrix.
Gregor Thomas