Ich habe versucht, einige Testdaten für die logistische Regression zu erstellen, und diesen Beitrag gefunden. Wie simuliere ich künstliche Daten für die logistische Regression?
Es ist eine schöne Antwort, aber es werden nur kontinuierliche Variablen erstellt. Was ist mit einer kategorialen Variablen x3 mit 5 Ebenen (ABCDE), die y für dasselbe Beispiel wie im Link zugeordnet sind?
r
logistic
simulation
user1301295
quelle
quelle
Antworten:
Das Model
Sei wenn man die Kategorie "B" hat, und sonst x B = 0 . Definieren Sie x C , x D und x E ähnlich. Wenn x B = x C = x D = x E = 0 ist , haben wir die Kategorie "A" (dh "A" ist der Referenzpegel). Ihr Modell kann dann als geschrieben werdenxB.= 1 xB.= 0 xC. xD. xE. xB.= xC.= xD.= xE.= 0
mit β 0 als Achsenabschnitt.
Datengenerierung in R.
(ein)
Der
x
Vektor hatn
Komponenten (eine für jedes Individuum). Jede Komponente ist entweder "A", "B", "C", "D" oder "E". Jedes von "A", "B", "C", "D" und "E" ist gleich wahrscheinlich.(b)
dummy(x)
n
(c)
Die Erfolgswahrscheinlichkeiten ergeben sich aus dem Logistikmodell:
(d)
pi[i]
Einige schnelle Simulationen, um dies zu überprüfen, sind in Ordnung
quelle