Wie wandle ich ordinale Daten vom Fragebogen in korrekte Intervalldaten um?

In dieser Antwort werden mögliche Modelle aus einer Messperspektive erörtert , in der wir eine Reihe von beobachteten (manifesten) zusammenhängenden Variablen oder Messgrößen erhalten, deren gemeinsame Varianz als Maß für ein genau identifiziertes, aber nicht direkt beobachtbares Konstrukt (im Allgemeinen reflektierend) angenommen wird Weise), die als latente Variable betrachtet wird . Wenn Sie mit dem Modell der Messung latenter Merkmale nicht vertraut sind, empfehle ich die folgenden zwei Artikel: Der Angriff der Psychometriker von Denny Borsbooom und Latent Variable Modeling: Eine Umfrage von Anders Skrondal und Sophia Rabe-Hesketh. Ich werde zunächst einen kleinen Exkurs mit binären Indikatoren machen, bevor ich mich mit Elementen mit mehreren Antwortkategorien befasse.

Eine Möglichkeit, ordinale Daten in Intervallskalen umzuwandeln, ist die Verwendung eines Item-Response- Modells. Ein bekanntes Beispiel ist das Rasch-Modell , das die Idee des Paralleltestmodells von der klassischen Testtheorie auf binär bewertete Items erweitertdurch ein verallgemeinertes (mit Logit-Link) lineares Modell mit gemischten Effekten (in einigen der 'modernen' Softwareimplementierungen), bei dem die Wahrscheinlichkeit, einen bestimmten Artikel zu befürworten, eine Funktion von 'Artikelschwierigkeit' und 'Personenfähigkeit' ist (vorausgesetzt, es gibt keine) Interaktion zwischen dem Standort des zu messenden latenten Merkmals und dem Standort des Gegenstands auf derselben logit-Skala, die durch einen zusätzlichen Parameter zur Artikelunterscheidung erfasst werden kann, oder Interaktion mit individuellen spezifischen Merkmalen, die als differenzielle Artikelfunktion bezeichnet wird . Es wird angenommen, dass das zugrunde liegende Konstrukt eindimensional ist, und die Logik des Rasch-Modells ist nur, dass der Befragte eine bestimmte Menge des Konstrukts hat - sprechen wir über die Haftung des Subjekts (seine / ihre Fähigkeit). $\theta$ Ebenso wie jedes Element, das dieses Konstrukt definiert (ihre "Schwierigkeit"). Was von Interesse ist, ist der Unterschied zwischen dem Ort des Befragten und dem Ort des Gegenstands auf der Messskala . Um ein konkretes Beispiel zu geben, betrachten Sie die folgende Frage: "Es fiel mir schwer, mich auf etwas anderes als meine Angst zu konzentrieren" (ja / nein). Eine Person, die an Angststörungen leidet, wird diese Frage mit größerer Wahrscheinlichkeit positiv beantworten als eine zufällige Person aus der Allgemeinbevölkerung, bei der in der Vergangenheit keine Depressionen oder Angststörungen aufgetreten sind. $\theta$

$N=766$ $\alpha=0.971$ $[0.967;0.975]$ ). Anfänglich wurden für jedes Element fünf Antwortkategorien vorgeschlagen (1 = "Nie", 2 = "Selten", 3 = "Manchmal", 4 = "Oft" und 5 = "Immer"). Wir werden hier nur binär bewertete Antworten betrachten.

Bildbeschreibung hier eingeben
_{(Hier wurden Antworten auf Likert-artige Elemente als binäre Antworten umkodiert (1/2 = 0, 3-5 = 1), und wir gehen davon aus, dass jedes Element für Einzelpersonen gleichermaßen diskriminierend ist, daher die Parallelität zwischen Elementkurvensteigungen (Rasch Modell).)}

$x$

Für polytomen Artikel mit geordneten Kategorien, gibt es mehrere Möglichkeiten: das Teilkreditmodell , das Rating - Skala - Modell oder das abgestufte Antwortmodell , um nur ein paar , die in der angewandten Forschung hauptsächlich verwendet werden. Die ersten beiden gehören zur sogenannten "Rasch-Familie" der IRT-Modelle und haben die folgenden Eigenschaften: (a) Monotonie der Antwortwahrscheinlichkeitsfunktion (Item / Category-Antwortkurve), (b) Ausreichende individuelle Gesamtpunktzahl (mit latenter Punktzahl) Parameter als fest angesehen), (c) lokale Unabhängigkeit bedeutet, dass die Reaktionen auf Items unabhängig sind, abhängig vom latenten Merkmal, und (d) das Fehlen einer differenziellen Item-Funktion Dies bedeutet, dass Antworten, abhängig vom latenten Merkmal, unabhängig von externen individuellen Variablen sind (z. B. Geschlecht, Alter, ethnische Zugehörigkeit, SES).

Wird das vorherige Beispiel auf den Fall ausgedehnt, in dem die fünf Antwortkategorien effektiv berücksichtigt werden, hat ein Patient eine höhere Wahrscheinlichkeit, die Antwortkategorie 3 bis 5 zu wählen, als jemand, der aus der Allgemeinbevölkerung ohne Vorkenntnisse von Angststörungen befragt wurde. Verglichen mit der oben beschriebenen Modellierung dichotomer Elemente berücksichtigen diese Modelle entweder den kumulativen (z. B. die Wahrscheinlichkeit, auf 3 vs. 2 oder weniger zu antworten) oder den Schwellenwert für benachbarte Kategorien (Wahrscheinlichkeit, auf 3 vs. 2 zu antworten), der auch in Agrestis Categorical erörtert wird Datenanalyse(Kapitel 12). Der Hauptunterschied zwischen den oben genannten Modellen liegt in der Art und Weise, wie Übergänge von einer Antwortkategorie zur anderen gehandhabt werden: Das Teilkreditmodell geht nicht davon aus, dass die Differenz zwischen einem bestimmten Schwellenort und dem Mittelwert der Schwellenorte auf dem latenten Merkmal gleich oder ist im Gegensatz zum Bewertungsskalenmodell artikelübergreifend einheitlich. Ein weiterer subtiler Unterschied zwischen diesen Modellen besteht darin, dass einige von ihnen (wie das uneingeschränkte abgestufte Antwort- oder Teilkreditmodell) ungleiche Unterscheidungsparameter zwischen Elementen zulassen. Weitere Informationen finden Sie unter Anwenden der Modellierung der Item-Response-Theorie zur Bewertung der Item- und Scale-Eigenschaften des Fragebogens von Reeve und Fayers oder unter Die Basis der Item-Response-Theorie von Frank B. Baker.

Da wir im vorhergehenden Fall die Interpretation der Antwortwahrscheinlichkeitskurven für dichotom bewertete Elemente erörtert haben, betrachten wir die Elementantwortkurven, die aus einem abgestuften Antwortmodell abgeleitet wurden, und heben dieselben Zielelemente hervor:

Bildbeschreibung hier eingeben
_{(Unbeschränktes abgestuftes Reaktionsmodell, das eine ungleiche Diskriminierung zwischen Elementen ermöglicht.)}

Hier verdienen die folgenden Beobachtungen eine Überlegung:

$[2;2.5]$
Es gibt eine allgemeine Verschiebung von links nach rechts zwischen der Einschätzung der Schlafqualität und der Einschätzung schwererer Zustände, obwohl Schlafstörungen keine Seltenheit sind. Dies wird erwartet: Schließlich können auch Menschen in der Allgemeinbevölkerung unabhängig von ihrem Gesundheitszustand Schwierigkeiten beim Einschlafen haben, und Menschen, die stark depressiv oder ängstlich sind, können solche Probleme aufweisen. Es ist jedoch unwahrscheinlich, dass „normale Personen“ (falls dies jemals eine Bedeutung hatte) Anzeichen einer Panikstörung aufweisen (die Wahrscheinlichkeit, dass sie die höchste Antwortkategorie wählen, ist null für Personen, die sich im mittleren oder höheren Bereich des latenten Merkmals befinden, [ 0; 1]).

$\theta$

Rasch-Modelle werden nicht nur als echte Messmodelle angesehen , sondern zeichnen sich auch dadurch aus , dass Summenwerte als ausreichende Statistik als Ersatz für die latenten Werte verwendet werden können. Darüber hinaus impliziert die Suffizienz-Eigenschaft leicht die Trennbarkeit von Modellparametern (Personen und Gegenstände) (im Fall von polytomen Gegenständen sollte nicht vergessen werden, dass alles auf der Ebene der Gegenstands-Antwortkategorie gilt), daher ist die Additivität gleichbedeutend.

Eine gute Übersicht über IRT Modellhierarchie, mit R Implementierung ist in Mair und Hatzinger den Artikel in der veröffentlichten Journal of Statistical Software : Erweiterte Rasch Modellierung: Das ERM - Paket für die Anwendung von IRT - Modelle in R . Andere Modelle umfassen logarithmische lineare Modelle , nicht parametrische Modelle wie das Mokken-Modell oder grafische Modelle .

Abgesehen von R sind mir keine Excel-Implementierungen bekannt, aber für diesen Thread wurden verschiedene Statistikpakete vorgeschlagen: Wie fange ich mit der Anwendung der Item-Response-Theorie an und welche Software soll verwendet werden?

Wenn Sie schließlich die Beziehungen zwischen einer Menge von Elementen und einer Antwortvariablen untersuchen möchten, ohne auf ein Messmodell zurückzugreifen, kann auch eine Form der Variablenquantisierung durch optimale Skalierung interessant sein. Neben den in diesen Threads diskutierten R-Implementierungen wurden SPSS-Lösungen auch für verwandte Threads vorgeschlagen .

Verweise

P. Pilkonis, S. Choi, S. Reise, A. Stover und W. Riley et al. (2011). Itembanken zur Messung von emotionaler Belastung aus dem Informationssystem zur Messung von Patientenergebnissen (PROMIS): Depression, Angst und Wut . Einschätzung , 18 (3), 263–283.
Choi, S., Gibbons, L. und Crane, P. (2011). lordif: Ein R-Paket zum Erkennen der Funktion von Differentialelementen unter Verwendung von iterativen hybriden ordinalen logistischen Regressionen / Item Response Theory- und Monte-Carlo-Simulationen . Journal of Statistical Software , 39 (8).

chl
quelle

@Momo Danke. Das ist neugierig. Bei der Beantwortung (und erneuten Bearbeitung dieser Antwort heute) ist mir Ihr Kommentar nicht aufgefallen, der eine hohe +1 wert ist. Bitte zögern Sie nicht, meine Antwort zu bearbeiten, wo Sie es für richtig halten.

chl

Alan Agresti behandelt in seinem Buch Analysis of Ordinal Categorical Data mehrere. Eines davon sind Ridits, die ich in meinem Blog bespreche

Peter Flom - Wiedereinsetzung von Monica
quelle

Können Sie das etwas näher erläutern? Auf den ersten Blick scheint es, als wäre jede Methode, die behauptet, Ordnungsdaten objektiv in Intervalldaten zu übersetzen, magisch, da man immer nicht so pathologische Gegenbeispiele geben könnte, die jede Methode "brechen" würden, aber ich könnte vermissen etwas Wichtiges. Es scheint auch so, als würde es eine Voraussage über die Entfernung zwischen Ordnungskategorien erfordern - wo kommt das her?

Makro

Die Formeln befinden sich im Blog-Beitrag, und eine vollständige Diskussion findet sich in Agrestis Buch. Im Wesentlichen werden jedoch die Daten verwendet, um "durchschnittliche kumulative Anteile" zu erstellen, und diese werden dann als Bewertungen verwendet. Die Distanz ergibt sich aus den Proportionen in jeder Antwort und nicht aus irgendetwas in den Kategorien.

Peter Flom - Reinstate Monica

+1. Ridits lassen sich leicht als Bruch minus + (1/2) Bruch gleich erklären. Wenn also 1, 2, 3, 4, 5 Brüche oder Wahrscheinlichkeiten von 0,2, 0,4, 0,2, 0,1, 0,1 beobachtet haben, dann ist der Ridit von 1 0,1; Der Wert von 2 ist 0,4 usw. Ridits behandeln Kategorien symmetrisch und enthalten infolgedessen mit geringerer Wahrscheinlichkeit als der Bruchteil weniger oder der Bruchteil mehr 0 oder 1, was häufig umständlich ist.

Nick Cox

Der Name ridit selbst wurde von Bross scherzhaft gewollt (Anmerkung: Referenz erforderlich) und die angebliche Erklärung ist Kauderwelsch. Bessere Namen sind die Mittelverteilungsfunktion (Parzen 1993) und die Klassenfunktion Haberman (1996). Haberman, SJ 1996. Advanced Statistics Volume I: Beschreibung der Populationen . New York: Springer. Parzen, E. 1993. Ändern Sie den PP-Plot und die Quantilfunktion der kontinuierlichen Probe. Mitteilungen in der Statistik - Theorie und Methoden 22: 3287-3304.

Nick Cox

Ridits selbst können zB durch normale oder Gaußsche Quantilfunktionen durchgeschoben werden.

Nick Cox

Wie wandle ich ordinale Daten vom Fragebogen in korrekte Intervalldaten um?

Antworten:

Verweise