Ich bin Arzt, bitte seien Sie freundlich zu mir und meinem grundlegenden Verständnis der Statistik.
Ich habe einen Datensatz, der aus Patienten und ihren Besuchen besteht, und ich habe das Vorhandensein einer bestimmten Art von Maulwurf in ihrer linken und / oder rechten Hand mit {0,1} -Werten (0 = nicht vorhanden und 1 = vorhanden) gekennzeichnet. Der Datensatz sieht folgendermaßen aus:
** Ich habe es entfernt, da die Antworten bereitgestellt werden. Ich kann es auf neue Anfrage senden
Das bedeutet also, dass der Patient A1-001 6 Besuche hatte, bei denen bei allen Besuchen kein Maulwurf in der rechten Hand vorhanden war und bei allen Besuchen außer dem ersten Maulwurf in der linken Hand vorhanden war.
Ich bin daran interessiert, die Wahrscheinlichkeit zu finden, dass eine Hand einen Maulwurf entwickelt, nur unter den Patienten, die in einer Hand einen Maulwurf entwickelt haben, und die Wahrscheinlichkeit, einen Maulwurf in der anderen Hand zu entwickeln (vorausgesetzt, der Patient hatte bereits einen Maulwurf in der anderen Hand). .
Darüber hinaus möchte ich wissen, wie hoch die Wahrscheinlichkeit ist, bei Besuchen bei Patienten, die irgendwann in beiden Händen einen Maulwurf entwickelt haben, einen Maulwurf zu entwickeln
Können Sie mir helfen, diese einfachen Fragen zu modellieren?
Antworten:
Ich persönlich bin der Meinung, dass sich dies gut für eine Überlebensanalyse eignet.
Sie haben zu Beginn des Zeitraums Menschen ohne Muttermale in einer bestimmten Hand (Ihre Risikopopulation); Sie können diese auswählen und haben Zeitpunkte für die Nachverfolgung und ob sie zensiert wurden oder nicht (ein Maulwurf entwickelt). Dies birgt eine Gefahr für die von Ihnen ausgewählte Kohorte.
Sie können dann eine Gefährdungsquote berechnen (z. B. für die Entwicklung eines rechten Maulwurfs bei Personen mit einem linken Maulwurf zu Studienbeginn im Vergleich zu Personen ohne). Dies könnte in einem Kaplan-Meier-Diagramm ausgedrückt werden und wird mit einem Konfidenzintervall geliefert.
quelle
Hier muss keine Modellierung durchgeführt werden. Alle Ihre Fragen sind einfache bedingte Wahrscheinlichkeiten.
Okay, da die Leute diese Antwort nicht verstanden haben, müssen Sie einige Dinge klären.
Meinst du pro besuch Oder dass sie nie einen Maulwurf entwickelt haben? Aus Ihrem Beispiel:
Die Patienten 1 und 3 entwickelten einerseits einen Maulwurf. Patient 1 hat dagegen nie einen Maulwurf entwickelt, Patient 3 jedoch. Sie könnten also argumentieren, dass die Antwort auf Ihre Frage 50% beträgt. Nun könnte man auch argumentieren, dass Patient 1 4 Kontrolluntersuchungen mit 1 Mol und nicht auf der anderen Seite hatte und Patient 3 0 Kontrolluntersuchungen mit 1 Mol und nicht auf der anderen Seite hatte, sodass die Wahrscheinlichkeit 1/5 = 20% betragen könnte. Es hängt davon ab, wie Sie Ihre Frage definieren.
quelle
Persönlich denke ich, dass Sie mit dem Studium der verallgemeinerten linearen Multikovarianzmodelle beginnen können : https://cran.r-project.org/web/packages/mcglm/index.html
https://cran.r-project.org/web/packages/mcglm/vignettes/GLMExamples.html
http://cursos.leg.ufpr.br/mcglm4aed/slides/2-mcglm.html#(1)
Diese Modelle sind geeignet, wenn Sie mehr als eine Antwortvariable haben und sie nicht gaußsch sind. Dies ist Ihr Fall, da Sie zwei binäre Variablen haben (Mol oder nicht Mol in jeder Hand). Mit dieser Methode können Sie auch intraindividuelle Abhängigkeiten behandeln, die durch die Längsstruktur gegeben sind. Längsschnitt bedeutet hier wiederholte Messungen für dieselbe Person entlang der Zeit.
Ich denke, die obigen Links helfen Ihnen dabei, eine gute Vorstellung von diesen Techniken zu bekommen, und sie bieten auch die rechnerische Implementierung in R.
quelle