Kontext:
Ich habe zwei Datensätze aus demselben Fragebogen, die über zwei Jahre laufen. Jede Frage wird anhand einer 5-Likert-Skala gemessen.
Q1: Codierungsschema
Im Moment habe ich meine Antworten in einem Intervall von [0, 1] codiert, wobei 0 "negativste Antwort", 1 "positivste Antwort" und andere gleichmäßig verteilte Antworten bedeuten.
- Was ist das "beste" Codierungsschema für die Likert-Skala?
Mir ist klar, dass dies etwas subjektiv sein könnte.
F2: Bedeutung über Jahre hinweg
- Wie lässt sich am besten feststellen, ob sich in den beiden Jahren statistisch signifikante Veränderungen ergeben?
Wenn ich mir die Ergebnisse für Frage 1 für jedes Jahr anschaue, wie kann ich feststellen, ob der Unterschied zwischen dem Ergebnis 2011 und dem Ergebnis 2010 statistisch signifikant ist? Ich habe eine vage Erinnerung daran, dass der T-Test des Schülers hier von Nutzen ist, bin mir aber nicht sicher.
Der Wilcoxon-Ranksum-Test alias Mann-Whitney ist der richtige Weg für Ordnungsdaten. Die Bootstrapping-Lösung ist auch elegant, wenn auch nicht der "klassische" Weg. Die Bootstrapping-Methode kann auch nützlich sein, wenn Sie andere Dinge wie die Faktoranalyse anstreben. Im Falle einer Regressionsanalyse können Sie geordnetes Probit oder geordnetes Logit als Modellspezifikation auswählen.
Übrigens: Wenn Ihre Skala einen größeren Bereich hat (> 10 Werte pro Variable), können Sie die Ergebnisse als metrische Variable verwenden, was einen T-Test zu einer sicheren Wahl macht. Seien Sie darauf hingewiesen, dass dies ein wenig schmutzig ist und von einigen als Teufelsarbeit angesehen werden kann.
stephan
quelle