Gibt es unkomplizierte Methoden, um Daten der Ordnungszahl in Intervallebenen umzuwandeln (genau so, wie es umgekehrt der Fall ist)? Und ausführbar in Excel oder SPSS?
Wenn ich die Daten habe, sagen wir: 10 Fragen auf der Ordinalebene (sagen wir 0-5, wobei 0 = "überhaupt nicht", 5 = "die ganze Zeit"), möchte ich sie transformieren, damit sie als richtig behandelt werden können Intervall-Level-Daten für parametrische Testzwecke (Normalverteilung, nicht-parametrische Tests nicht in Frage).
Wäre sehr dankbar für Antworten!
Antworten:
In dieser Antwort werden mögliche Modelle aus einer Messperspektive erörtert , in der wir eine Reihe von beobachteten (manifesten) zusammenhängenden Variablen oder Messgrößen erhalten, deren gemeinsame Varianz als Maß für ein genau identifiziertes, aber nicht direkt beobachtbares Konstrukt (im Allgemeinen reflektierend) angenommen wird Weise), die als latente Variable betrachtet wird . Wenn Sie mit dem Modell der Messung latenter Merkmale nicht vertraut sind, empfehle ich die folgenden zwei Artikel: Der Angriff der Psychometriker von Denny Borsbooom und Latent Variable Modeling: Eine Umfrage von Anders Skrondal und Sophia Rabe-Hesketh. Ich werde zunächst einen kleinen Exkurs mit binären Indikatoren machen, bevor ich mich mit Elementen mit mehreren Antwortkategorien befasse.
Eine Möglichkeit, ordinale Daten in Intervallskalen umzuwandeln, ist die Verwendung eines Item-Response- Modells. Ein bekanntes Beispiel ist das Rasch-Modell , das die Idee des Paralleltestmodells von der klassischen Testtheorie auf binär bewertete Items erweitertdurch ein verallgemeinertes (mit Logit-Link) lineares Modell mit gemischten Effekten (in einigen der 'modernen' Softwareimplementierungen), bei dem die Wahrscheinlichkeit, einen bestimmten Artikel zu befürworten, eine Funktion von 'Artikelschwierigkeit' und 'Personenfähigkeit' ist (vorausgesetzt, es gibt keine) Interaktion zwischen dem Standort des zu messenden latenten Merkmals und dem Standort des Gegenstands auf derselben logit-Skala, die durch einen zusätzlichen Parameter zur Artikelunterscheidung erfasst werden kann, oder Interaktion mit individuellen spezifischen Merkmalen, die als differenzielle Artikelfunktion bezeichnet wird . Es wird angenommen, dass das zugrunde liegende Konstrukt eindimensional ist, und die Logik des Rasch-Modells ist nur, dass der Befragte eine bestimmte Menge des Konstrukts hat - sprechen wir über die Haftung des Subjekts (seine / ihre Fähigkeit).θ Ebenso wie jedes Element, das dieses Konstrukt definiert (ihre "Schwierigkeit"). Was von Interesse ist, ist der Unterschied zwischen dem Ort des Befragten und dem Ort des Gegenstands auf der Messskala . Um ein konkretes Beispiel zu geben, betrachten Sie die folgende Frage: "Es fiel mir schwer, mich auf etwas anderes als meine Angst zu konzentrieren" (ja / nein). Eine Person, die an Angststörungen leidet, wird diese Frage mit größerer Wahrscheinlichkeit positiv beantworten als eine zufällige Person aus der Allgemeinbevölkerung, bei der in der Vergangenheit keine Depressionen oder Angststörungen aufgetreten sind.θ
(Hier wurden Antworten auf Likert-artige Elemente als binäre Antworten umkodiert (1/2 = 0, 3-5 = 1), und wir gehen davon aus, dass jedes Element für Einzelpersonen gleichermaßen diskriminierend ist, daher die Parallelität zwischen Elementkurvensteigungen (Rasch Modell).)
Für polytomen Artikel mit geordneten Kategorien, gibt es mehrere Möglichkeiten: das Teilkreditmodell , das Rating - Skala - Modell oder das abgestufte Antwortmodell , um nur ein paar , die in der angewandten Forschung hauptsächlich verwendet werden. Die ersten beiden gehören zur sogenannten "Rasch-Familie" der IRT-Modelle und haben die folgenden Eigenschaften: (a) Monotonie der Antwortwahrscheinlichkeitsfunktion (Item / Category-Antwortkurve), (b) Ausreichende individuelle Gesamtpunktzahl (mit latenter Punktzahl) Parameter als fest angesehen), (c) lokale Unabhängigkeit bedeutet, dass die Reaktionen auf Items unabhängig sind, abhängig vom latenten Merkmal, und (d) das Fehlen einer differenziellen Item-Funktion Dies bedeutet, dass Antworten, abhängig vom latenten Merkmal, unabhängig von externen individuellen Variablen sind (z. B. Geschlecht, Alter, ethnische Zugehörigkeit, SES).
Wird das vorherige Beispiel auf den Fall ausgedehnt, in dem die fünf Antwortkategorien effektiv berücksichtigt werden, hat ein Patient eine höhere Wahrscheinlichkeit, die Antwortkategorie 3 bis 5 zu wählen, als jemand, der aus der Allgemeinbevölkerung ohne Vorkenntnisse von Angststörungen befragt wurde. Verglichen mit der oben beschriebenen Modellierung dichotomer Elemente berücksichtigen diese Modelle entweder den kumulativen (z. B. die Wahrscheinlichkeit, auf 3 vs. 2 oder weniger zu antworten) oder den Schwellenwert für benachbarte Kategorien (Wahrscheinlichkeit, auf 3 vs. 2 zu antworten), der auch in Agrestis Categorical erörtert wird Datenanalyse(Kapitel 12). Der Hauptunterschied zwischen den oben genannten Modellen liegt in der Art und Weise, wie Übergänge von einer Antwortkategorie zur anderen gehandhabt werden: Das Teilkreditmodell geht nicht davon aus, dass die Differenz zwischen einem bestimmten Schwellenort und dem Mittelwert der Schwellenorte auf dem latenten Merkmal gleich oder ist im Gegensatz zum Bewertungsskalenmodell artikelübergreifend einheitlich. Ein weiterer subtiler Unterschied zwischen diesen Modellen besteht darin, dass einige von ihnen (wie das uneingeschränkte abgestufte Antwort- oder Teilkreditmodell) ungleiche Unterscheidungsparameter zwischen Elementen zulassen. Weitere Informationen finden Sie unter Anwenden der Modellierung der Item-Response-Theorie zur Bewertung der Item- und Scale-Eigenschaften des Fragebogens von Reeve und Fayers oder unter Die Basis der Item-Response-Theorie von Frank B. Baker.
Da wir im vorhergehenden Fall die Interpretation der Antwortwahrscheinlichkeitskurven für dichotom bewertete Elemente erörtert haben, betrachten wir die Elementantwortkurven, die aus einem abgestuften Antwortmodell abgeleitet wurden, und heben dieselben Zielelemente hervor:
(Unbeschränktes abgestuftes Reaktionsmodell, das eine ungleiche Diskriminierung zwischen Elementen ermöglicht.)
Hier verdienen die folgenden Beobachtungen eine Überlegung:
Rasch-Modelle werden nicht nur als echte Messmodelle angesehen , sondern zeichnen sich auch dadurch aus , dass Summenwerte als ausreichende Statistik als Ersatz für die latenten Werte verwendet werden können. Darüber hinaus impliziert die Suffizienz-Eigenschaft leicht die Trennbarkeit von Modellparametern (Personen und Gegenstände) (im Fall von polytomen Gegenständen sollte nicht vergessen werden, dass alles auf der Ebene der Gegenstands-Antwortkategorie gilt), daher ist die Additivität gleichbedeutend.
Eine gute Übersicht über IRT Modellhierarchie, mit R Implementierung ist in Mair und Hatzinger den Artikel in der veröffentlichten Journal of Statistical Software : Erweiterte Rasch Modellierung: Das ERM - Paket für die Anwendung von IRT - Modelle in R . Andere Modelle umfassen logarithmische lineare Modelle , nicht parametrische Modelle wie das Mokken-Modell oder grafische Modelle .
Abgesehen von R sind mir keine Excel-Implementierungen bekannt, aber für diesen Thread wurden verschiedene Statistikpakete vorgeschlagen: Wie fange ich mit der Anwendung der Item-Response-Theorie an und welche Software soll verwendet werden?
Wenn Sie schließlich die Beziehungen zwischen einer Menge von Elementen und einer Antwortvariablen untersuchen möchten, ohne auf ein Messmodell zurückzugreifen, kann auch eine Form der Variablenquantisierung durch optimale Skalierung interessant sein. Neben den in diesen Threads diskutierten R-Implementierungen wurden SPSS-Lösungen auch für verwandte Threads vorgeschlagen .
Verweise
quelle
Alan Agresti behandelt in seinem Buch Analysis of Ordinal Categorical Data mehrere. Eines davon sind Ridits, die ich in meinem Blog bespreche
quelle