Additiver Fehler oder multiplikativer Fehler?

13

Ich bin relativ neu in der Statistik und würde mich über ein besseres Verständnis freuen.

In meinem Bereich gibt es ein häufig verwendetes Modell der Form:

Pt=PÖ(Vt)α

Wenn Benutzer das Modell an Daten anpassen, linearisieren sie es normalerweise und passen Folgendes an

Log(Pt)=Log(PÖ)+αLog(Vt)+ϵ

Ist das ok? Ich habe irgendwo gelesen, dass wegen Rauschen im Signal das eigentliche Modell sein sollte

Pt=PÖ(Vt)α+ϵ

und dies kann nicht wie oben linearisiert werden. Ist das wahr? Wenn ja, weiß jemand von einer Referenz, die ich lesen und mehr darüber erfahren und wahrscheinlich in einem Bericht zitieren kann?

ciaran_r
quelle
Ich habe deine Gleichungen formatiert. Bitte überprüfen Sie, ob der Inhalt noch Ihren Vorstellungen entspricht (insbesondere in Bezug auf Abonnements).
Andy
Sie haben Ihre Frage mit "Messfehler" gekennzeichnet, und das + e in der 3. Gleichung scheint auf einen additiven Messfehler zuzüglich einer multiplikativen stochastischen / zufälligen Variation in der Antwort zurückzuführen zu sein, etwa P * (V ^ alpha) *. exp (e). Ist das richtig? Messfehlermodelle (auch als "Fehler in Variablen" bezeichnet) erfordern häufig eine Art zweistufigen Prozess, für den in Ihrem Fall möglicherweise separate Validierungsdaten erforderlich sind, um den additiven Fehler aufgrund von "Rauschen" zu charakterisieren. In diesem Fall gibt es möglicherweise keinen müssen die Gleichung linearisieren.
N Brouwer

Antworten:

14

Welches Modell geeignet ist, hängt davon ab, wie die Variation um den Mittelwert in die Beobachtungen einfließt. Es kann durchaus multiplikativ oder additiv eintreten ... oder auf andere Weise.

Es kann sogar mehrere Quellen für diese Variation geben, von denen einige multiplikativ und einige additiv eintreten können und einige auf eine Weise, die nicht wirklich als eine von beiden charakterisiert werden kann.

Manchmal gibt es eine klare Theorie, um festzustellen, welche geeignet ist. Manchmal zeigt das Nachdenken über die Hauptquellen für Variationen über den Mittelwert eine geeignete Wahl. Häufig haben die Menschen keine klare Vorstellung davon, welche Art sie verwenden sollen, oder ob verschiedene Arten von Variationsquellen erforderlich sind, um den Prozess angemessen zu beschreiben.

Mit dem log-linearen Modell, bei dem die lineare Regression verwendet wird:

Log(Pt)=lÖG(PÖ)+αLog(Vt)+ϵ

Das OLS-Regressionsmodell geht von einer konstanten Varianz der logarithmischen Skala aus. Ist dies der Fall, zeigen die Originaldaten eine zunehmende Streuung um den Mittelwert, wenn der Mittelwert zunimmt.

Auf der anderen Seite, diese Art von Modell:

Pt=PÖ(Vt)α+ϵ

wird im Allgemeinen durch nichtlineare kleinste Quadrate angepasst, und wenn eine konstante Varianz (die Standardeinstellung für NLS) angepasst wird, sollte der Spread um den Mittelwert konstant sein.

Bildbeschreibung hier eingeben

[Sie haben möglicherweise den visuellen Eindruck, dass die Streuung im letzten Bild mit zunehmendem Mittelwert abnimmt. Das ist eigentlich eine Illusion, die durch die zunehmende Neigung verursacht wird. Wir neigen dazu, die Ausbreitung eher orthogonal als vertikal zu beurteilen, damit wir einen verzerrten Eindruck bekommen.]

Wenn Sie eine nahezu konstante Streuung auf der ursprünglichen oder der logarithmischen Skala haben, kann dies darauf hindeuten, welches der beiden Modelle passt, nicht weil es sich als additiv oder multiplikativ erweist, sondern weil es zu einer angemessenen Beschreibung der Streuung und der logarithmischen Skala führt bedeuten.

Natürlich könnte man auch die Möglichkeit eines additiven Fehlers haben, der eine nicht konstante Varianz aufweist.

Es gibt jedoch noch andere Modelle, in denen solche funktionalen Beziehungen angepasst werden können, die unterschiedliche Beziehungen zwischen Mittelwert und Varianz aufweisen (z. B. ein Poisson- oder Quasi-Poisson-GLM, dessen Ausbreitung proportional zur Quadratwurzel des Mittelwerts ist).

Glen_b - Setzen Sie Monica wieder ein
quelle