Protokoll des Durchschnitts v. Durchschnitt des Protokolls

7

Ich erstelle einen Datensatz mit monatlichen Durchschnittswerten basierend auf täglichen Daten. Dieser Datensatz wird für die Standardregressionsanalyse verwendet. Ich gehe davon aus, dass ich die abhängige Variable transformieren möchte, die eine ungefähr logarithmische Normalverteilung aufweist. Meine Frage ist, ob es angemessener ist, die Daten vor oder nach dem monatlichen Durchschnitt zu transformieren.

BLimkins
quelle
2
Wenn Sie dies tun, bevor Sie den Durchschnitt nehmen, arbeiten Sie tatsächlich in geometrischen Durchschnittswerten: 1Ni=1Nlog(xi)=log((i=1Nxi)1N)
Wenn Sie etwas über die monatlichen Durchschnittswerte erfahren möchten, aber eine Regression ihrer Logarithmen durchführen, erhalten Sie normalerweise nicht das, wonach Sie suchen, genauso wie ein geometrisches Mittel der Daten nicht unbedingt ein guter Schätzer für das arithmetische Mittel ist . Bitte teilen Sie uns dann die Ziele Ihrer Regressionsanalyse mit.
whuber
Es gibt einige mögliche Ziele. Eine besteht darin, zu bestimmen, welcher Anteil der Variation in der abhängigen Variablen durch eine Reihe erklärender Variablen erklärt wird. Die andere besteht darin, die Antwort der abhängigen Variablen auf eine Vorher / Nachher-Dummy-Variable zu messen. In beiden Fällen ist mir bewusst, dass die Durchführung der Analyse in Protokollen zusätzliche Arbeit erfordert, um die Auswirkungen in Ebenen zu interpretieren.
BLimkins

Antworten:

1

Wenn Sie die Annahme beibehalten, dass die täglich abhängige Variable des Monats einer logarithmischen Normalverteilung folgt, bedeutet dies, dassYjii

lnYjiN(μji,σji2)

Dann haben wir mit die Anzahl der Tage des Monats auchdii

1dilnYjiN(μjidi,σji2di2)

Wenn Sie auch davon ausgehen, dass Ihre Stichprobe aus unabhängigen Beobachtungen besteht, folgt die Summe der unabhängigen normalen Zufallsvariablen mit Sicherheit auch einer Normalverteilung und so weiter

j=1di1dilnYji=1dij=1dilnYjiN(1dij=1diμji,1di2j=1diσji2)

Mit anderen Worten, wenn eine logarithmische Normalitätsannahme auf der Ebene einer Stichprobe unabhängiger täglicher Daten angegeben wird, wird auch der monatliche Durchschnitt der Protokolle der ursprünglichen täglichen Variablen (deren geometrischer Mittelwert, wie in einem Kommentar erwähnt) normal verteilt.

Alecos Papadopoulos
quelle
0

Die Frage ist, was logarithmisch normal verteilt ist.

Ich gehe davon aus, dass es monatliche Serien sind. In diesem Fall den Durchschnitt ermitteln und dann protokollieren.

Wenn Sie der Meinung sind, dass die täglichen Reihen logarithmisch normal verteilt sind, liegt Ihre durchschnittliche monatliche Reihe sehr nahe an der normalen Verteilung, wenn keine große Autokorrelation vorliegt.

Aksakal
quelle