Abweichung gegen Pearson Passgenauigkeit

8

Ich versuche, ein Modell mit negativer Binomialregression (negatives Binomial-GLM) zu entwickeln. Ich habe eine relativ kleine Stichprobengröße (größer als 300) und die Daten sind nicht skaliert. Mir ist aufgefallen, dass es zwei Möglichkeiten gibt, die Anpassungsgüte zu messen - eine Abweichung und die Pearson-Statistik. Wie kann ich bestimmen, welches Maß für die Anpassungsgüte verwendet werden soll? Gibt es einige Kriterien, die ich bei der Auswahl des Maßes für die Anpassungsgüte berücksichtigen kann?

Jin-Dominique
quelle
Ich bin mir nicht sicher, was Sie unter "Ich habe eine relativ kleine Stichprobengröße (größer als 300)" verstehen.
Dason
@Dason 300 ist keine sehr große Zahl in ähnlicher Genexpression
HelloWorld

Antworten:

10

Der auf Abweichungen basierende Anpassungstest ist ein Likelihood-Ratio-Test zwischen dem angepassten und dem gesättigten Modell (einer, bei dem jede Beobachtung ihren eigenen Parameter erhält). Pearson's Test ist ein Score-Test; Der erwartete Wert der Punktzahl (die erste Ableitung der Log-Likelihood-Funktion) ist Null, wenn das angepasste Modell korrekt ist, und Sie nehmen eine größere Differenz von Null als stärkeren Beweis für mangelnde Anpassung. Die Theorie wird in Smyth (2003), "Pearsons Statistik der Anpassungsgüte als Score-Test-Statistik", Statistik und Wissenschaft: eine Festschrift für Terry Speed diskutiert .

In der Praxis verlassen sich die Menschen normalerweise auf die asymptotische Annäherung beider an die Chi-Quadrat-Verteilung - für ein negatives Binomialmodell bedeutet dies, dass die erwarteten Zahlen nicht zu klein sein sollten. Smyth merkt an, dass der Pearson-Test robuster gegen Modellfehlspezifikationen ist, da Sie das angepasste Modell nur als Null betrachten, ohne eine bestimmte Form für ein gesättigtes Modell annehmen zu müssen. Ich habe nie einen großen Unterschied zwischen ihnen bemerkt.

Vielleicht möchten Sie darüber nachdenken, dass ein erheblicher Mangel an Übereinstimmung mit beiden Ihnen sagt, was Sie wahrscheinlich bereits wissen: dass Ihr Modell keine perfekte Darstellung der Realität ist. Je größer Ihre Stichprobe ist, desto wahrscheinlicher wird Ihnen dies mitgeteilt. Vielleicht ist eine wichtigere Frage, ob Sie Ihr Modell verbessern können oder nicht und welche Diagnosemethoden Ihnen helfen können.

Scortchi - Monica wieder einsetzen
quelle