Stellen Sie sich eine Situation vor: Wir haben historische Aufzeichnungen (20 Jahre) von drei Minen. Erhöht das Vorhandensein von Silber die Wahrscheinlichkeit, im nächsten Jahr Gold zu finden? Wie teste ich eine solche Frage?
Hier sind Beispieldaten:
mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
"rock","rock","rock","rock","silver","rock","rock",
"rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
"silver","gold","gold","gold","gold","gold","rock",
"silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
"rock","silver","rock","rock","rock","rock","silver",
"gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)
r
time-series
hypothesis-testing
stochastic-processes
Ladislav Naďo
quelle
quelle
Antworten:
Mein bester Versuch: ... Die Verwendung der von @AndyW vorgeschlagenen Übergangsmatrizen ist wahrscheinlich nicht die Lösung, nach der ich suche (basierend auf dem Kommentar von @ Tim). Also habe ich einen anderen Ansatz versucht. Ich habe diesen Link gefunden, der sich mit der logistischen Regression befasst, bei der die Antwortvariable y und eine Prädiktorvariable x beide binär sind .
Gemäß Beispiel sollte ich basierend auf meinen Daten eine 2 × 2-Tabelle erstellen:
Wie ich die Werte extrahiert habe:
Und konstruiere ein Modell:
Ist es eine gute Lösung? Bedeutet der p-Wert (0,673), dass das Vorhandensein von Silber die Wahrscheinlichkeit, Gold zu finden, nicht erhöht?
quelle
yes = c(2, 14), no = c(7, 34)
, was bedeutet, dass Sie Silber setzen: Ja zuerst. Wenn Sie dies tun, entsprichtas.factor(c(0, 1))
die 0 Silber: Ja, das ist Ihr Referenzpegel und damit Ihr Achsenabschnitt. Der p-Wert von 0,67 entspricht dem kleinen positiven Anstieg, den Sie bei der Wahrscheinlichkeit erhalten, dass sich Gold von Silber zu Silber bewegt: Ja zu Silber: Nein.