Ich erstelle einen Datensatz mit monatlichen Durchschnittswerten basierend auf täglichen Daten. Dieser Datensatz wird für die Standardregressionsanalyse verwendet. Ich gehe davon aus, dass ich die abhängige Variable transformieren möchte, die eine ungefähr logarithmische Normalverteilung aufweist. Meine Frage ist, ob es angemessener ist, die Daten vor oder nach dem monatlichen Durchschnitt zu transformieren.
regression
data-transformation
lognormal
average
BLimkins
quelle
quelle
Antworten:
Wenn Sie die Annahme beibehalten, dass die täglich abhängige Variable des Monats einer logarithmischen Normalverteilung folgt, bedeutet dies, dassYji i
Dann haben wir mit die Anzahl der Tage des Monats auchdi i
Wenn Sie auch davon ausgehen, dass Ihre Stichprobe aus unabhängigen Beobachtungen besteht, folgt die Summe der unabhängigen normalen Zufallsvariablen mit Sicherheit auch einer Normalverteilung und so weiter
Mit anderen Worten, wenn eine logarithmische Normalitätsannahme auf der Ebene einer Stichprobe unabhängiger täglicher Daten angegeben wird, wird auch der monatliche Durchschnitt der Protokolle der ursprünglichen täglichen Variablen (deren geometrischer Mittelwert, wie in einem Kommentar erwähnt) normal verteilt.
quelle
Die Frage ist, was logarithmisch normal verteilt ist.
Ich gehe davon aus, dass es monatliche Serien sind. In diesem Fall den Durchschnitt ermitteln und dann protokollieren.
Wenn Sie der Meinung sind, dass die täglichen Reihen logarithmisch normal verteilt sind, liegt Ihre durchschnittliche monatliche Reihe sehr nahe an der normalen Verteilung, wenn keine große Autokorrelation vorliegt.
quelle