Ich analysiere derzeit Daten aus einer Reihe von Verhaltensexperimenten, die alle das folgende Maß verwenden. Die Teilnehmer dieses Experiments werden gebeten, Hinweise auszuwählen, mit deren Hilfe (fiktive) andere Personen eine Reihe von 10 Anagrammen lösen können. Die Teilnehmer werden glauben gemacht, dass diese anderen Menschen entweder Geld gewinnen oder verlieren werden, abhängig von ihrer Leistung beim Lösen der Anagramme. Die Anhaltspunkte unterscheiden sich darin, wie hilfreich sie sind. Zum Beispiel könnten für das Anagramm NUNGRIN, ein Anagramm von RUNNING, drei Hinweise sein:
- Schnell bewegen (nicht hilfreich)
- Was machst du bei einem Marathonlauf? (Hilfreich)
- Nicht immer ein gesundes Hobby (nicht hilfreich)
Um die Messung zu bilden, zähle ich, wie oft (von 10) ein Teilnehmer einen nicht hilfreichen Hinweis für die andere Person auswählt. In den Experimenten benutze ich verschiedene Manipulationen, um die Nützlichkeit der von den Leuten ausgewählten Hinweise zu beeinflussen.
Da die Hilfsbereitschafts- / Nicht-Hilfsbereitschaftsmessung ziemlich stark positiv verzerrt ist (ein großer Teil der Benutzer wählt immer die 10 hilfreichsten Hinweise aus) und weil die Messung eine Zählvariable ist, habe ich ein verallgemeinertes lineares Modell von Poisson verwendet, um diese Daten zu analysieren. Als ich jedoch noch etwas mehr über die Poisson-Regression las, stellte ich fest, dass die Poisson-Regression den Mittelwert und die Varianz einer Verteilung nicht unabhängig voneinander schätzt und die Varianz in einem Datensatz häufig unterschätzt. Ich begann Alternativen zur Poisson-Regression zu untersuchen, wie zum Beispiel die Quasipoisson-Regression oder die negative binomiale Regression. Allerdings gebe ich zu, dass ich mit solchen Modellen noch nicht so vertraut bin. Deshalb komme ich hierher, um Rat zu holen.
Hat jemand Empfehlungen, welches Modell für diese Art von Daten verwendet werden soll? Gibt es noch andere Überlegungen, die ich berücksichtigen sollte (ist beispielsweise ein bestimmtes Modell leistungsfähiger als ein anderes?)? Auf welche Art von Diagnose sollte ich achten, um festzustellen, ob das ausgewählte Modell meine Daten angemessen verarbeitet?
quelle
Antworten:
Ihr Ergebnis ist die Anzahl der hilfreichen Hinweise aus 10, die eine binomische Zufallsvariable ist. Sie sollten es also mit einer Art binomischer Regression analysieren, wahrscheinlich quasi-binomisch, um eine Überdispersion zu ermöglichen. Beachten Sie, dass die Poisson- und die irreführend genannten negativen Binomialverteilungen für unbegrenzte Zähldaten geeignet sind.
quelle
betabin
imaod
Paket wird es tun.Ich würde auch empfehlen, das negative Binomial zu betrachten, wenn die möglichen Ergebnisse wie beim Poisson unendlich wären. Vielleicht möchten Sie eines der Bücher von Joe Hilbe konsultieren. Er hat eine auf GEE und eine auf negative binomische Regression, die er mit Poisson-Regression kontrastiert. Aber wie von Aniko hervorgehoben, gibt es nur 10 Hinweise, so dass jeder Befragte nur 0, 1, 2, 3, ..., 10 haben kann und daher weder Poisson noch negative Exponentialwerte angemessen sind.
quelle
Guter Punkt von @Aniko. Eine andere Wahl ist die Beta-Regression. Es gab eine Arbeit mit dem Titel "A Better Lemon Squeezer" , die viele Informationen zu dieser Methode enthielt.
quelle