Welche Arten von Codierungen sind für kategoriale Variablen (in R) verfügbar und wann würden Sie sie verwenden?

14

Wenn Sie ein lineares Modell oder ein gemischtes Modell anpassen, stehen verschiedene Codierungstypen zur Verfügung, um eine kategoriale oder nominelle Varibale in eine Reihe von Variablen zu transformieren, für die Parameter geschätzt werden, z. B. Dummy-Conding (Standardeinstellung R) und Effektcodierung.

Ich habe gehört, dass die Effektcodierung (manchmal auch als Abweichungs- oder Kontrastcodierung bezeichnet) bei Interaktionen bevorzugt wird, aber welche Kontraste sind möglich und wann würden Sie welche Art von Kontrast verwenden?

Der Kontext ist gemischte Modellierung in R lme4, aber ich denke, breitere Antworten sind in Ordnung. Entschuldigung, wenn ich eine ähnliche Frage verpasst habe.

EDIT: Zwei hilfreiche Links sind: Effektcodierung & Dummy-Codierung erklärt.

Henrik
quelle
Wenn Sie mit S-Plus über moderne angewandte Statistik verfügen, finden Sie in Kapitel 6 einen hervorragenden Abschnitt zu dieser Frage
richiemorrisroe
4
Ich glaube nicht , dass Sie eine vollständige Antwort auf Ihre Frage finden, aber es gibt eine Menge guter Informationen über die verschiedenen Arten von Codierungen hier .
gung - Wiedereinsetzung von Monica
@gung Die Seite sieht wirklich interessant aus. Es scheint jedoch nicht die Kontrastcodierung abzudecken (oder gibt es einen anderen Namen dafür).
Henrik,
Ich bin mir nicht sicher; Ich frage mich, ob es einen Kommunikationsfehler gibt. Der Titel dieser Seite lautet "Kontrastcodierung".
gung - Wiedereinsetzung von Monica
1
Ich verstehe nicht genau, welche Frage noch offen ist. Wenn Sie eine Liste verschiedener Codierungstypen haben möchten, haben Sie diese. Was ist der Hauptschwerpunkt Ihrer Frage?
gung - Wiedereinsetzung von Monica

Antworten:

4

Andere können mich aufklären, wenn ich falsch liege, aber hier ist es…

Was ist der Effekt für das Level im Vergleich zum Mittel der vorherigen Level? Das heißt, Sie sind daran interessiert, die Schwelle des Effekts zu lokalisieren

  • Verwenden Sie Helmert-Kontraste. Ich betrachte dies als kumulative Vergleiche. Ich habe dies verwendet, wenn ich daran interessiert war, eine Dosis-Wirkungs-Grenze der Exposition zu bestimmen. Ein Vergleich mit mehreren Ebenen gleichzeitig bedeutet, dass weniger Informationen weggeworfen werden. Ich betrachte dies als kumulative Vergleiche.

Was ist der Effekt des Levels im Verhältnis zu einem Basislevel? Sie interessieren sich also für eine Vergleichsgruppe.

  • Verwenden Sie die Dummy-Variablencodierung (Behandlungskontraste). Ich betrachte dies als Vergleichsbasis. Ich habe dies verwendet, wenn es normalerweise eine Gruppe / Ebene gibt, die von anderen Studien als wichtig eingestuft wurde, und meine Studie zeigt, dass Assoziationen auch bestehen, wenn diese Schwelle überschritten wird.

Was bewirken zwei benachbarte Ebenen einer Variablen?

  • Verwenden Sie die Vorwärts- / Rückwärtsdifferenzierung. Ich betrachte dies als kurz aufeinanderfolgende Vergleiche. Ich habe dies verwendet, um Effekte für verschiedene Ebenen der sozioökonomischen Position zu vergleichen, wenn jede Gruppe für sich genommen unterschiedlich zusammengesetzt ist und nicht mehr von Interesse ist als jede andere.
Gavin
quelle