Vergleich der AIC eines Modells und seiner log-transformierten Version

17

Das Wesentliche meiner Frage ist:

Sei eine multivariate normale Zufallsvariable mit Mittelwert und Kovarianzmatrix . Sei , dh . Wie vergleiche ich den AIC eines Modells, das mit beobachteten Realisierungen von übereinstimmt, mit einem Modell, das mit beobachteten Realisierungen von ? μ Σ Z : = log ( Y ) Z i = log ( Y i ) , i { 1 , , n } Y ZYRnμΣZ:=log(Y)Zi=log(Yi),i{1,,n}YZ



Meine anfängliche und etwas längere Frage:

Sei eine multivariate normale Zufallsvariable. Wenn ich eine Modellanpassung an einer Modellanpassung an vergleichen möchte , könnte ich ihre Log-Wahrscheinlichkeiten untersuchen. Da diese Modelle jedoch nicht verschachtelt sind, kann ich die Log-Wahrscheinlichkeiten (und solche wie AIC usw.) nicht direkt vergleichen, sondern muss sie umwandeln.Y log ( Y )YN(μ,Σ)Ylog(Y)

Ich weiß, dass wenn Zufallsvariablen mit gemeinsamen pdf und wenn für Eins-zu-Eins-Transformationen und , dann ist das pdf von gegeben durch wobei J der mit der Transformation verbundene Jacobian ist. g ( x 1 , ... , x n ) Y i = t i ( X 1 , ... , X n ) t i i { 1 , ... , n } Y 1 , ... , Y n f ( y 1 , , y n ) = gX1,,Xng(x1,,xn)Yi=tich(X1,,Xn)tii{1,,n}Y1,,Yn

f(y1,,yn)=g(t11(y),,tn1(y))det(J)
J

Muss ich zum Vergleichen einfach die Transformationsregel verwenden?

l(Y)=log(i=1nϕ(yi;μ,Σ))
bis
l(log(Y))=log(i=1nϕ(log(yi);μ,Σ))

oder gibt es noch etwas was ich tun kann?


[edit] Ich habe vergessen, Logarithmen in die letzten beiden Ausdrücke einzufügen.

Stijn
quelle
Sie scheinen im letzten Ausdruck auch den Jakobianer verloren zu haben.
Whuber
2
Ich verstehe die Umwandlung nicht. Wie können Sie wenn negativ ist? LogLogY.Y.
Semibruin

Antworten:

6

Sie können den AIC oder BIC nicht vergleichen, wenn Sie zwei verschiedene Datensätze, dh und anpassen . Sie können nur zwei Modelle vergleichen, die auf AIC oder BIC basieren, wenn sie zu demselben Datensatz passen. Schauen Sie sich Modellauswahl und Multi-Modell-Inferenz an: Ein praktischer informationstheoretischer Ansatz (Burnham und Anderson, 2004). Sie erwähnten meine Antwort auf Seite 81 (Abschnitt 2.11.3 Transformationen der Antwortvariablen):Y.Z

Die Ermittler sollten sicherstellen, dass alle Hypothesen unter Verwendung derselben Antwortvariablen modelliert werden (wenn z. B. die gesamte Modellmenge auf log (y) basiert, würde kein Problem entstehen; es ist das Mischen von Antwortvariablen, das falsch ist).

Übrigens müssen Ihre Modelle für die Verwendung der AIC- oder BIC-Kriterien nicht unbedingt verschachtelt sein (dieselbe Referenz, Seite 88, Abschnitt 2.12.4 Nicht verschachtelte Modelle), und dies ist einer der Vorteile der Verwendung von BIC.

Stat
quelle
5

Akaike (1978, S. 224) beschreibt, wie der AIC in Gegenwart einer transformierten Ergebnisvariablen angepasst werden kann, um einen Modellvergleich zu ermöglichen. Er führt aus: „Der Effekt der Transformation der Variablen wird einfach durch die Multiplikation der Wahrscheinlichkeit des entsprechenden Jacobi mit dem AIC dargestellt. Für den Fall von ist dies −2 , wobei sich die Summe über . "& Sigma; l o g { y ( n ) + 1 } n = 1 , 2 , . . . , NlÖG{y(n)+1}lÖG{y(n)+1}n=1,2,...,N

Akaike, H. 1978. "Zur Wahrscheinlichkeit eines Zeitreihenmodells", Journal of the Royal Statistical Society, Reihe D (The Statistician), 27 (3/4), S. 217–235.

Gord B
quelle
1
Gibt es einen Ansatz in R, um dies zu tun?
theforestecologist