Habe ich diese Wahrscheinlichkeitsverhältnisse richtig berechnet?

18

Ich bin der Autor des ez-Pakets für R und arbeite an einem Update, das die automatische Berechnung von Likelihood Ratios (LRs) in die Ausgabe von ANOVAs einbezieht. Die Idee ist, einen LR für jeden Effekt bereitzustellen, der dem Test des Effekts entspricht, den die ANOVA erzielt. Das LR für den Haupteffekt stellt beispielsweise den Vergleich eines Nullmodells mit einem Modell dar, das den Haupteffekt enthält. Das LR für eine Interaktion stellt den Vergleich eines Modells dar, das beide Komponentenhaupteffekte enthält, mit einem Modell, das beide Haupteffekte und enthält ihre Interaktion usw.

Mein Verständnis der LR-Berechnung kommt nun von Glover & Dixon ( PDF ), in dem grundlegende Berechnungen sowie Korrekturen für die Komplexität behandelt werden, und dem Anhang zu Bortolussi & Dixon ( PDF-Anhang ), in dem Berechnungen mit Variablen mit wiederholten Maßen behandelt werden. Um mein Verständnis zu testen, habe ich diese Tabelle entwickelt , die die dfs & SSs aus einer Beispiel-ANOVA (generiert aus einem 2 * 2 * 3 * 4-Entwurf unter Verwendung gefälschter Daten) entnimmt und die Berechnung des LR für jeden Effekt durchführt.

Ich würde es wirklich begrüßen, wenn jemand mit ein wenig mehr Vertrauen in solche Berechnungen einen Blick darauf werfen und sicherstellen könnte, dass ich alles richtig gemacht habe. Für diejenigen, die abstrakten Code bevorzugen, ist hier der R-Code , der das Update auf ezANOVA () implementiert (siehe vor allem Zeilen 15-95).

Mike Lawrence
quelle

Antworten:

3

Obwohl die Überlegungen zur Berechnung des LR aus den SS-Werten durchaus gerechtfertigt sind, ist eine Methode der kleinsten Quadrate gleichbedeutend mit einer Wahrscheinlichkeitsschätzung. (Der Unterschied kann zB in der Berechnung der se dargestellt werden, die bei einem Ansatz der kleinsten Quadrate durch (n-1) und bei einer maximalen Wahrscheinlichkeit durch n geteilt wird. Die maximale Wahrscheinlichkeitsschätzung ist somit konsistent, aber leicht verzerrt ).

Dies hat einige Implikationen: Sie können das LR berechnen, da die Wahrscheinlichkeit proportional zu , aber dies gibt Ihnen nicht die Wahrscheinlichkeit Ihres Anova-Modells. Es sagt Ihnen nur etwas über das Verhältnis. Da der AIC in Bezug auf die Wahrscheinlichkeit klassisch definiert ist, bin ich mir nicht sicher, ob Sie den AIC so verwenden können, wie Sie es beabsichtigen.1s

Ich habe mir die Tabelle angesehen, aber die Werte für das "unkorrigierte LR innerhalb" (ich verfolge auch nicht vollständig, was genau Sie dort zu berechnen versuchen) scheinen mir höchst unwahrscheinlich.

Nebenbei bemerkt, die Stärke des LR-Tests besteht darin, dass Sie nur die gewünschten Modelle gegenüberstellen können und dies nicht für alle Modelle tun müssen (wodurch der Multitest-Fehler verringert wird). Wenn Sie dies für jeden Term tun, entspricht Ihr LR vollständig einem F-Test, und im Fall der kleinsten Quadrate, soweit ich auch numerisch weiß, ungefähr dem gleichen.

Ihre Meile mag variieren, aber ich war mir nie sicher, Konzepte zweier verschiedener Frameworks zu mischen (dh kleinste Quadrate versus maximale Wahrscheinlichkeit). Persönlich würde ich die F-Statistik melden und das LR in eine Funktion implementieren, die es ermöglicht, Modelle zu vergleichen (z. B. die Anova-Funktion für IME-Modelle, die genau das tut).

Meine 2 Cent.

PS: Ich habe mir Ihren Code angesehen, konnte aber nicht alle Variablen herausfinden. Wenn Sie Ihren Code mit Kommentaren kommentieren würden, würde dies das Leben wieder ein bisschen einfacher machen. Das EXCEL-Blatt ist auch nicht am einfachsten herauszufinden. Ich werde später noch einmal nachsehen, ob ich etwas daraus machen kann.

Joris Meys
quelle