Ist es gültig, ein ARMAX-Modell für die TV-Zuordnung zu verwenden?

7

Angenommen, ich habe eine Website mit stündlichem Basisverkehr. Ich schalte auch zeitweise Fernsehwerbung, was meinen Webverkehr steigert. Ich möchte feststellen, welchen Einfluss meine Fernsehwerbung auf die Steigerung des Webverkehrs hat.

Wenn ich ein ARMAX-Modell mit stündlichen TV-Werbeausgaben oder Impressionen als exogenen Variablen anpasse, kann dann behauptet werden, dass die AR-Begriffe den "Basisverkehr" darstellen, während die Regressionsbegriffe den Verkehr darstellen, der der Fernsehwerbung zugeordnet werden sollte?

Hier ist ein Beispielcode für das, was ich versuche:

library(forecast)

xmat <- as.matrix(cbind(data[,c("AdSpend","Impressions")]))
xvar <- data$WebSessions

fit <- Arima(x=xvar, xreg=xmat, order=c(12,0,0), include.constant=FALSE)

reg_terms <- fit$coef["AdSpend"] * data$AdSpend + fit$coef["Impressions"] * data$Impressions
AR_terms <- fitted(fit) - reg_terms

Ich kann dann ein gestapeltes Flächendiagramm mit AR_terms (dem stündlichen Basis-Webverkehr) und reg_terms (dem vom Fernseher zugewiesenen stündlichen Verkehr) erstellen.

Geben Sie hier die Bildbeschreibung ein

Ist das ein gültiger Ansatz?

Danke für die Hilfe.

Peter
quelle

Antworten:

2

Dies ist eine ausgezeichnete Frage. Ich empfehle Ihnen, sich eine Tasse Kaffee zu holen und Rob Hyndmans Blogbeitrag über "The ARIMAX model muddle" sorgfältig durchzulesen .

Grundsätzlich lautet die Antwort nein. Wenn Sie ein einfaches AR (I) MAX-Modell verwenden, können Ihre kovariaten Koeffizienten nicht als Promotion-Effekt interpretiert werden. Das Problem ist, dass eine Änderung eines kovariaten Werts Auswirkungen auf die Prognose hat , die von vorherigen Anpassungen abhängt . Dies ist sehr schwer zu interpretieren und zu kommunizieren.

Allerdings ist nicht alles verloren, denn Ihr Anruf an R Arima()ist nicht in der Tat paßt einen AR (I) MAX - Modell. Vielmehr werden zunächst Ihre Beobachtungen zu den Kovariaten zurückgeführt und anschließend die Residuen mit einem AR (I) MA-Prozess modelliert. Das heißt, es passt zu einer sogenannten Regression mit AR (I) MA-Fehlern . Und für dieses Modell ist Ihre Interpretation - die Kovariaten und ihre Koeffizienten erfassen Werbeeffekte, während der ARMA-Teil "den Rest" erfasst - vollkommen gültig.

Ob ein AR (I) MAX-Modell oder eine Regression mit AR (I) MA-Fehlern bessere Prognosen liefert, weiß ich nicht. Da ich keine einfache Möglichkeit kenne, ein AR (I) MAX-Modell tatsächlich in R einzubauen, und die oben beschriebenen Interpretationsschwierigkeiten, würde ich empfehlen, dass Sie sich nicht übermäßig um echte AR (I) MAX-Modelle und -Sticks sorgen mit was Arima()gibt dir.

Ich vermute jedoch, dass Web-Surfen und Fernsehen möglicherweise haben - Die Muster innerhalb eines Tages können zwischen dem Wochenende und dem Rest der Woche unterschiedlich sein. Ich sehe dies nicht in Ihrer Handlung, aber Sie möchten vielleicht prüfen, ob Ihre Daten dies aufweisen. In diesem Fall wurde an Prognosen mit mehreren Saisonalitäten gearbeitet , wobei hauptsächlich Varianten der exponentiellen Glättung und / oder der Zustandsraummodelle verwendet wurden. Einige davon können möglicherweise mehrere Saisonalitäten und erklärende Variablen gleichzeitig modellieren.

Stephan Kolassa
quelle
Tolle Antwort, danke! Ich habe vor, ein komplexeres Modell zu erstellen, wollte aber nur sehen, ob der allgemeine Ansatz korrekt ist.
Peter