Ermittlung der am besten korrelierten Zeitreihen

8

Bevor ich frage, lese ich ähnliche Fragen, aber keine davon führt zu zufriedenstellenden Antworten für mein spezifisches Interesse.

Ich möchte eine Klimazeitreihe der Niederschläge der Dominikanischen Republik über 64 Jahre (1940-2003) homogenisieren. Dafür ist es wirklich wichtig, eine Referenzserie aus einer Gruppe von Kandidaten auszuwählen.

Angenommen, es sjohandelt sich um die Basisserie, für die ich eine gute Referenzserie finden möchte. bani, plcUnd rasind Referenz Kandidaten, weil sie in der Nähe sind sjo. In der folgenden Karte ist der rote Punkt die Basisstation und die grünen sind die Referenzkandidaten:

Ich führte drei Korrelationsanalysen (durchgeführt in R, Funktion cor()) unter Berücksichtigung dieser monatlichen Variablen durch: Rohniederschlagswert, normalisierte Differenz und transformierte Werte mit Box-Cox. Diese Variablen entsprechen jeweils zu Feldern , die mit beginnen p, dianund pnorm.

Die normalisierte Differenz stammt aus der von Peterson vorgeschlagenen ersten Differenzreihenmethode (FDM), bestehend aus: , wobei der Niederschlagswert ist für den Monat und ist der Niederschlag für denselben Monat 1 Jahr zuvor. Ich folgte der Bemerkung von Peterson und Kollegen (1998) , wonach FDM, das auf Niederschläge angewendet wird, unter Verwendung normalisierter Unterschiede möglicherweise besser funktioniert.[P.mt- -P.mt- -1]]/.[P.mt+P.mt- -1]]P.mtmP.mt- -1

Wie auf Seite 1 dieser PDF-Datei zu sehen ist , wurde die Korrelation für die gesamte Zeitreihe (1940-2003) berechnet. Für Rohniederschlag und Box-Cox-transformierte Werte baniist dies am besten korreliert sjo(gelbe Hintergrundzellen zeigen den maximalen Korrelationsindex). Beachten Sie, dass der Rohniederschlag baniwesentlich stärker korreliert als andere. Für normalisierte Differenz raist nur ein bisschen mehr korreliert als der Rest. Jedoch hat jede Kandidatenstation einen statistisch signifikante Korrelation mit index sjoam Signifikanzniveau, was darauf hindeutet , jede von ihnen als eine Referenzreihe verwendet werden könnte.α=.05

Dies ist etwas verwirrend, daher war ich unzufrieden und entschied mich für eine detailliertere Analyse, bei der die Serie in 5-Jahres-Intervalle aufgeteilt und die Korrelation zwischen den Serien für dieselben 3 Variablen bewertet wurde: Rohniederschlag, normalisierte Differenz und Box-Cox-Transformation .

Tabellen von Seite 2 bis 8 im PDF zeigen die Ergebnisse dieser Teilkorrelationen; Die letzte Seite fasst die Zeiten zusammen, zu denen jede Station den maximalen Korrelationswert für jede Variable hatte. Wie zu sehen ist, baniist dies der am häufigsten korrelierte Wert für die 3 analysierten Variablen (in allen Fällen mehr als das 7-fache der zwölf analysierten 5-Jahres-Zeiträume).

Mit diesen Ergebnissen denke ich, dass dies banider beste Kandidat als Referenzserie ist sjo, aber ich bin mir nicht sicher. Ist die Fünfjahresanalyse in Ordnung? Sollte ich eine andere Analyse durchführen?

JoseRamon
quelle
Danke @Nick für Korrekturen, ich habe viel von ihnen gelernt. Entschuldigung, Englisch ist nicht meine Muttersprache.
JoseRamon
Ich bin froh, Ihnen helfen zu können :) Ihre Arbeit war bereits klarer als die vieler Muttersprachler! Meine Änderungen waren nur kosmetischer und technischer Natur, nicht wesentlich. Willkommen bei CV BTW!
Nick Stauner
Die Korrelationen sind signifikant, aber sind die Unterschiede zwischen diesen Korrelationen unterschiedlich? Wenn nicht, können Sie aufgrund von Korrelationen nicht eine Referenzstation über eine andere
auswählen
Danke @Aksakal für deinen Kommentar. Für den gesamten analysierten Zeitraum und ausschließlich für Rohniederschläge weist 'sjo' (die Basisreihe) diese Korrelationsindizes mit Referenzkandidaten auf: 0,650 mit 'bani', 0,536 mit 'plc' und 0,557 mit 'ra'. Ist der größte Index signifikant größer als der nächste korrelierter? In Bezug auf die anderen Variablen, normalisierte Differenz und Box-Cox-Transformation, ist die Differenz nicht groß. Sollte ich eine andere Analyse anwenden? Was würdest du mir vorschlagen?
JoseRamon
@ JoseRamon, ich kann diese Fragen nicht beantworten, Sie haben die Daten. Sie können die statistischen Tests durchführen, um festzustellen, ob der Unterschied signifikant ist
Aksakal

Antworten:

1

Wie wäre es, wenn Sie eine Zwei-Wege-Anova UND einen paarweisen Test versuchen, ob mit Ihren jährlichen Daten und / oder den 5-Jahres-Intervallen. Sie können dies auch mit den rohen, normalisierten Daten oder Box-Cox-Daten tun.

Die Idee ist, dass Sie nach nicht signifikanten (für die Referenzstation) Unterschieden zwischen den Niederschlagsverteilungen pro Station suchen können .

Ich fand diesen Link hilfreich, um Ihre eigene Zwei-Wege-Anova über R r-Tutorial-Serie-Zwei-Wege-Anova zu starten

Sebastian

tester1234
quelle
Danke Sebastian für deine Antwort. Ich werde diese Vorschläge ausprobieren, was sehr hilfreich erscheint. Ich habe es in einer anderen Forschung verwendet und ist sehr mächtig.
JoseRamon
Hallo nochmal @ tester1234. Ich versuche, den Zwei-Wege-Anova-Test für meine Daten durchzuführen. Basierend auf dem Link, den Sie mir vorgeschlagen haben: Was sollten meine beiden Faktoren sein? Darf ich sagen: Welche Variablen soll ich in die Funktion 'lm ()' einfügen? Ich habe Niederschlag von 3 Stationen (pbani, pplc, pra) und möchte wissen, welche am besten mit einer vierten (psjo) korreliert. Ich habe monatliche Daten, die in Intervallen von 5 Jahren gruppiert sind (Daten können über diesen Link heruntergeladen werden ). Vielen Dank im Voraus
JoseRamon