Wir haben 100 Teilnehmer in zwei Gruppen, in jeder Gruppe. Wir verwendeten eine Bewertung der Fähigkeit zur Grundfunktion zu 4 Zeitpunkten. Die Bewertung umfasst 6 Fragen, von denen jede mit 0 bis 5 bewertet wurde. Wir haben keine individuellen Bewertungen für jede Frage, sondern nur Gesamtbewertungen im Bereich von 0 bis 30. Höhere Bewertungen bedeuten eine bessere Funktionsweise. Das Problem ist, dass die Bewertung sehr grundlegend ist und einen signifikanten Deckeneffekt hat. Die Ergebnisse sind sehr negativ verzerrt. Die Mehrheit der Teilnehmer erzielte knapp 30 Punkte, insbesondere bei den 3 Nachbeobachtungszeitpunkten. Es ist wahrscheinlich, dass nicht alle Teilnehmer, die an den Obergrenzen punkten, wirklich die gleichen Fähigkeiten haben: Einige der Teilnehmer erzielten gerade 30 Punkte, andere erzielten mühelos 30 Punkte und würden viel höher punkten, wenn dies möglich wäre, und so sind die Daten von oben zensiert.
Ich möchte die beiden Gruppen und im Laufe der Zeit vergleichen, aber dies ist angesichts der Art der Ergebnisse offensichtlich sehr schwierig. Transformationen jeglicher Art machen keinen Unterschied. Mir wurde mitgeteilt, dass das Tobit-Modell für diese Bewertung am besten geeignet ist, und ich kann die Analyse in R anhand von Beispielen aus Arne Henningens Arbeit " Schätzen zensierter Regressionsmodelle in R mithilfe des censReg-Pakets" durchführen .
Ich verfüge jedoch nur über Grundkenntnisse in Statistik und habe festgestellt, dass Informationen zum Tobit-Modell ziemlich kompliziert sind. Ich muss in der Lage sein, dieses Modell im Klartext zu erklären, und ich kann keine Erklärung im Klartext und auf den Punkt bringen, was das Tobit-Modell tatsächlich tut und wie. Kann jemand das Tobit-Modell erklären oder mich in die Richtung einer lesbaren Referenz weisen, ohne komplizierte statistische und mathematische Erklärungen?
Äußerst dankbar für jede Hilfe
quelle
Es gibt einen Artikel von Berk in der Ausgabe 1983 der American Sociological Review (3. Ausgabe) - so habe ich etwas über Zensur gelernt. Die Erklärung bezieht sich speziell auf die Auswahlverzerrung, ist jedoch für Ihr Problem absolut relevant. Selektionsverzerrung, wie Berk diskutiert, ist nur eine Zensur über den Probenauswahlprozess, in Ihrem Fall ist die Zensur das Ergebnis eines unempfindlichen Instruments. Es gibt einige nette Diagramme, die Ihnen genau zeigen, wie Sie erwarten können, dass Ihre Regressionsgerade verzerrt ist, wenn Y auf unterschiedliche Weise zensiert wird. Im Allgemeinen ist der Artikel eher logisch und intuitiv als mathematisch (ja, ich behandle sie als getrennt und bevorzuge erstere). Tobit wird als eine Lösung für das Problem diskutiert.
Generell klingt es so, als ob tobit das richtige Werkzeug für den jeweiligen Job ist. Grundsätzlich funktioniert dies, indem die Wahrscheinlichkeit einer Zensur abgeschätzt und diese dann in die Gleichung zur Vorhersage der Punktzahl einbezogen wird. Von Heckman wird ein anderer Ansatz vorgeschlagen, bei dem probit und das inverse Mills-Verhältnis im Grunde genommen gleich sind, bei dem Sie jedoch unterschiedliche Variablen zur Vorhersage der Zensurwahrscheinlichkeit und des Testergebnisses verwenden können. Dies wäre natürlich für Ihre Situation nicht zutreffend haben.
Eine weitere Empfehlung: Sie können ein hierarchisches Tobit-Modell in Betracht ziehen, bei dem Beobachtungen in Einzelpersonen verschachtelt sind. Dies würde die Tendenz, dass Fehler innerhalb von Individuen auftreten, korrekt erklären. Wenn Sie kein hierarchisches Modell verwenden, müssen Sie zumindest Ihre Standardfehler für die Zusammenfassung der Beobachtungen innerhalb von Personen anpassen. Ich weiß, dass dies alles in Stata möglich ist, und bin zuversichtlich, dass R mit all seiner Vielseitigkeit es auch kann.
quelle