Variable als Zähldaten skalieren - richtig oder nicht?

10

In diesem Artikel (frei verfügbar über PubMed Central) verwenden die Autoren eine negative binomiale Regression, um die Punktzahl auf einem 10-Punkte-Screening-Instrument mit einer Bewertung von 0 bis 40 zu modellieren. Bei diesem Verfahren werden Zähldaten vorausgesetzt, was hier eindeutig nicht der Fall ist. Ich würde gerne Ihre Meinung dazu erfahren, ob dieser Ansatz akzeptabel ist, da ich in meiner Arbeit manchmal dasselbe oder ein ähnliches Instrument verwende. Wenn nicht, würde ich gerne wissen, ob es akzeptable Alternativen gibt. Weitere Details unten:

Die verwendete Skala ist der Test zur Identifizierung von Alkoholkonsumstörungen (AUDIT), ein 10-Punkte-Fragebogen, der als Screening-Instrument für Alkoholkonsumstörungen und gefährliches / schädliches Trinken entwickelt wurde. Das Instrument wird von 0 bis 40 bewertet, und die Ergebnisse sind in der Regel stark nach links verzerrt.

Nach meinem Verständnis setzt die Verwendung von Zähldaten voraus, dass alle Werte, die "gezählt" werden, unabhängig voneinander sind - Patienten, die jeden Tag auf eine Notaufnahme kommen, Anzahl der Todesfälle in einer bestimmten Gruppe usw. - sie sind alle unabhängig voneinander. obwohl abhängig von zugrunde liegenden Variablen. Darüber hinaus denke ich, dass es bei Verwendung von Zähldaten keine maximal zulässige Anzahl geben kann, obwohl ich denke, dass diese Annahme gelockert werden kann, wenn das theoretische Maximum im Vergleich zum beobachteten Maximum in den Daten sehr hoch ist.

Bei Verwendung der AUDIT-Skala haben wir keine echte Zählung. Wir haben 10 Artikel mit einer maximalen Gesamtpunktzahl von 40, obwohl diese hohen Punktzahlen in der Praxis selten zu sehen sind. Die Bewertungen der Elemente sind natürlich miteinander korreliert.

Die zur Verwendung von Zähldaten erforderlichen Annahmen werden somit verletzt. Aber ist das immer noch ein akzeptabler Ansatz? Wie schwerwiegend sind die Verstöße gegen die Annahmen? Gibt es bestimmte Umstände, unter denen dieser Ansatz als akzeptabler angesehen werden kann? Gibt es Alternativen zu diesem Ansatz, bei denen die Skalierungsvariable nicht auf Kategorien reduziert wird?

JonB
quelle

Antworten:

4

Das AUDIT-Instrument ist im Wesentlichen eine Likert-Skala. Eine Reihe von Fragen (Likert-Elemente) mit Antworten häufig auf einer Fünf-Punkte-Skala soll auf ein zugrunde liegendes Phänomen eingehen. Die Summe der Antworten auf die Fragen, die Likert-Skala, wird dann als Maß für das zugrunde liegende Phänomen verwendet. Obwohl Likert Artikel oft auf einer Skala von auf „stimmte stark“, „stimmen nicht zu “ sind die Anwendung eine Tendenz zur Messung in Richtung „ A lcohol U se D isorders“ in diesem „ ich RMITTLUNG T est“ ist einfach.

Auf der Wikipedia-Seite der Likert-Skala heißt es: "Ob einzelne Likert-Elemente als Daten auf Intervallebene betrachtet werden können oder ob sie als geordnete kategoriale Daten behandelt werden sollten, ist in der Literatur Gegenstand erheblicher Meinungsverschiedenheiten mit starken Überzeugungen darüber, was sie sind." die am besten geeigneten Methoden. " Dieser Streit geht wahrscheinlich auf den größten Teil der über 80 Jahre zurück, seit Likert die Skala zum ersten Mal vorgeschlagen hat: Entspricht jeder Schritt entlang der Skala sowohl innerhalb als auch zwischen den Elementen, aus denen die Skala besteht? Das Problem wurde bei Cross Validated behoben, da bei der Beantwortung dieser Frage eine der frühesten Fragen auf dieser Website gestellt wurde.

Wenn Sie die Idee akzeptieren, dass die Skala Schritte aufweist, die einheitlich sind (oder nahe genug an der Einheitlichkeit für die jeweilige Anwendung liegen, möglicherweise gemittelt durch Hinzufügen von 10 verschiedenen Elementen, wie in AUDIT), sind mehrere Analyseansätze möglich. Eine besteht darin, die Antwort auf der Skala als eine Reihe von Schritten zu betrachten, die ausgewählt oder nicht ausgewählt wurden, um die Skala nach oben zu bewegen, mit der gleichen Wahrscheinlichkeit, jeden der Schritte nach oben zu bewegen.

Dies ermöglicht es, sich " n-Punkt-Likert- Skalendaten als n Versuche aus einem Binomialprozess " vorzustellen, wie in einer Frage von @MikeLawrence aus dem Jahr 2010. Obwohl die Antworten auf diese Frage diese Idee nicht besonders unterstützten, war es heute nicht schwer, schnell eine Studie aus dem Jahr 2014 zu finden , die diesen Ansatz erfolgreich verwendete und erweiterte, um Subpopulationen mit unterschiedlichen binomialen Wahrscheinlichkeiten zu unterscheiden. Obwohl ein Binomialprozess häufig zum Modellieren von Zähldaten verwendet wird, kann er daher verwendet werden, um die Anzahl, die Anzahl der Schritte zu modellieren, die eine Person entlang der Skala von "Alkoholkonsumstörungen" unternommen hat.

Wie @Scortchi in einer Antwort auf die im zweiten Absatz verknüpfte Frage feststellte , besteht eine Einschränkung des Binomialmodells darin, dass es eine bestimmte Beziehung zwischen dem Mittelwert und der Varianz der Antwort auferlegt. Das negative Binomial beseitigt diese Einschränkung, wobei die einfache Interpretation des einfachen Binomialmodells verloren geht. In der Analyse verbraucht der zusätzliche Parameter, der angepasst werden muss, nur einen zusätzlichen Freiheitsgrad. Im Gegensatz dazu wäre es entmutigend zu versuchen, unterschiedliche Wahrscheinlichkeiten für jeden der 40 Likert-Item-Schritte und deren Summe in der Likert-Skala anzugeben.

Wie @MatthewGraves in seiner Antwort auf diese Frage feststellte, lässt sich die Prüfung der Residuen am besten beantworten, ob das negative Binomialmodell geeignet ist. In der ursprünglichen Studie , in der AUDIT entwickelt wurde, hatte ein Wert von 8 oder mehr auf der 40-Punkte-Skala eine vernünftige Spezifität und Sensitivität für die Unterscheidung derjenigen, bei denen in 6 verschiedenen Ländern ein "gefährlicher oder schädlicher Alkoholkonsum" diagnostiziert wurde. Vielleicht wäre ein Binomialmodell mit zwei Populationen, das auf Populationen mit hohem und niedrigem Risiko basiert, ähnlich der oben verlinkten Studie von 2014, besser.

Diejenigen, die sich speziell für AUDIT interessieren, sollten diese ursprüngliche Studie untersuchen. Obwohl die Notwendigkeit eines morgendlichen Getränks etwas völlig anderes als die Häufigkeit des Trinkens zu messen scheint, wie @SeanEaster vermutete, weist das morgendliche Trinken eine gewichtete mittlere Korrelation von 0,73 mit einer Skala von Maßen für den Alkoholkonsum auf. (Dieses Ergebnis ist für jemanden, der Freunde mit Alkoholkonsumstörungen hatte, nicht überraschend.) AUDIT scheint ein gutes Beispiel für die Kompromisse zu sein, die erforderlich sind, um ein Instrument zu entwickeln, das in mehreren Kulturen zuverlässig eingesetzt werden kann.

EdM
quelle
Vielen Dank für eine gute Antwort. Wenn ich meine eigenen AUDIT-Daten von mehr als 20000 Personen betrachte, sieht die Form einer negativen Binomialverteilung nahe, so dass es sinnvoll sein könnte, diese Verteilungsannahme zu verwenden, oder vielleicht könnte ein Quasi-Poisson-Modell verwendet werden? Wenn wir eine Binomialverteilung verwenden, indem wir die Punkte als k Erfolge aus 40 Bernoulli-Versuchen betrachten, haben wir dann kein ernstes Problem mit der Überdispersion? In meinen Daten sieht es so aus. Könnte Quasi-Binom eine Alternative sein?
JonB
Viel hängt davon ab, warum Sie die 0-40 AUDIT-Scores modellieren und welche heuristische Interpretation Sie den Ergebnissen hinzufügen möchten. Wenn Sie nur eine Beziehung der AUDIT-Scores zu anderen Variablen mit nur begrenzter Interpretation der Verteilungsparameterwerte selbst wünschen, verwenden Sie eine Verteilung, die gut verhaltene Residuen liefert. Ihre Vorschläge sind vernünftig. Das Anpassen eines einzelnen Binoms an die Daten ist problematisch, aber eine Mischung aus zwei Binomen (Hochrisiko- und Niedrigrisikogruppen) mit unterschiedlichem p kann informativ sein. Verwenden Sie Ihr Urteilsvermögen basierend auf Ihren Kenntnissen des Themas.
EdM
2

x=40x40

Generell haben verschiedene Arten der Regression unterschiedliche Prioritäten für Parameter (dh Regularisierung) und unterschiedliche Rauschmodelle. Die Standardregression der kleinsten Quadrate hat ein Gaußsches Rauschmodell, die negative Binomialregression ein negatives Binomialrauschmodell und so weiter. Der wahre Test, ob ein Regressionsmodell geeignet ist oder nicht, besteht darin, ob das Restrauschen die erwartete Verteilung aufweist oder nicht.

Sie können also eine negative Binomialregression auf Ihre Daten anwenden, die Residuen berechnen und sie dann auf einem negativen Binomialwahrscheinlichkeitsdiagramm darstellen und einen Eindruck davon bekommen, ob das Modell geeignet ist oder nicht. Wenn das Rauschen auf andere Weise strukturiert ist, müssen wir nach einem Rauschmodell suchen, das besser zu dieser Struktur passt.

Das Denken vom generativen Modell zur Rauschstruktur ist hilfreich - wenn wir beispielsweise wissen, dass die Daten multiplikativ statt additiv sind, greifen wir nach dem Lognormalen anstelle des Normalen - aber wenn das erwartete generative Modell und die Rauschstruktur nicht übereinstimmen, Gehen Sie mit den Daten, nicht mit der Erwartung.

Matthew Graves
quelle
Interessanterweise wusste ich nicht, dass die Ereignisse "ansteckend" sein könnten. Was meinst du in der Praxis damit, x = 40 durch x> = 40 zu ersetzen? Wie mache ich ein negatives Binomialwahrscheinlichkeitsdiagramm in R? Ich nehme an, Sie meinen nicht Plot-Residuen gegen angepasste Werte? Meinst du wie ein QQ-Plot?
JonB
@ JonB Angenommen, Sie haben ein negatives Binom mit r = 1 und der Erfolgswahrscheinlichkeit p = 0,9. Die Wahrscheinlichkeit, 40 Studien genau zu überleben, beträgt 0,148%; Die Wahrscheinlichkeit, 40 oder mehr Studien zu überleben, beträgt 1,48%. Man kann also eine wohlgeformte Wahrscheinlichkeit für die Domäne [0,40] definieren, indem man das negative Binom für [0,39] verwendet und dann [40] so einstellt, dass es zu eins summiert, was, weil die negative Binomialverteilung gut ist. gebildet ist die Wahrscheinlichkeit, dass es 40 oder mehr ist.
Matthew Graves
@ JonB Genau, ich meine wie ein QQ-Plot. Ich habe es noch nie in R gemacht, aber ich hoffe, dieser Link wird helfen.
Matthew Graves
1
Ich habe ein Experiment mit einigen Daten mit AUDIT-Werten durchgeführt. Beim Erstellen eines qq-Diagramms muss ein zufälliger Vektor von Ergebnissen aus einer negativen Binomialverteilung erstellt werden. Das Mu / Theta wird durch mein Regressionsmodell angegeben, aber wie kann ich wissen, welche "Größe" ich verwenden soll? Es tut mir leid, wenn dies eine R-spezifische Frage ist. Wie auch immer, haben Sie eine nette Referenz I, die ich mehr über das Anwenden eines negativen Binomials (und anderer Verteilungen) auf diese Arten von Skalen lesen kann, die durch Summieren mehrerer Elemente, die die Art messen, konstruiert wurden des gleichen Prozesses?
JonB
Ich habe jetzt einige zusätzliche Experimente durchgeführt. Ich habe einen Datensatz mit zwei Variablen simuliert: x und y. 50% sind x = 0, 50% sind x = 1. Diejenigen, die x = 0 sind, haben eine Wahrscheinlichkeit von 0,2 für y = 1, und diejenigen, die x = 1 sind, haben eine Wahrscheinlichkeit von 0,4 für y = 1. Ich habe dann eine logistische Regression durchgeführt und mir die Residuen angesehen. Die sehen überhaupt nicht binomial verteilt aus. Tatsächlich nehmen sie (natürlich) 4 spezifische Werte an. Sind Sie sicher, dass das Restmuster immer mit der Verteilungsannahme übereinstimmen sollte? Denn in diesem Fall ist es eindeutig falsch.
JonB