Wir haben einen potenziellen Biomarker, um vorherzusagen, ob ein Patient Krebs hat oder nicht. Das Biomarker-Testergebnis ist binär positiv oder negativ. Wir möchten ein Gefühl dafür bekommen, wie viele Patienten getestet werden müssen, um festzustellen, ob dieser Biomarker ein guter Prädiktor ist oder nicht.
Aus der Lektüre im Internet geht hervor, dass die Sensitivität (für die Anzahl der Fälle) und die Spezifität (für die Anzahl der Kontrollen) geprüft werden müssen. Es wird empfohlen, diese Situation als Proportional-Test mit einer Stichprobe zu behandeln. Es bleibt jedoch unklar, wie Sie die Empfindlichkeit und den Bereich, auf den Sie sich einstellen, einschätzen sollten. Wenn ich einen Biomarker mit einer Empfindlichkeit von mehr als 0,8 als "gut" bezeichne, wie würden Sie die beiden Variablen einrichten? Ich möchte, dass meine Nullhypothese als Biomarker nicht besser ist als eine zufällige Zuordnung, dh eine Sensitivität von 0,5. Könnte jemand ein Beispiel für den besten Weg geben, dies zu tun (besonders wenn es in R ist).
Antworten:
Sprechen wir über die Sensitivität (die wir mit ), die Spezifität ist ähnlich. Das Folgende ist ein frequentistischer Ansatz; Es wäre großartig, wenn einer der Bayesianer hier eine andere Antwort hinzufügen könnte, um eine alternative Vorgehensweise zu diskutieren.p
Angenommen, Sie haben krebskranke Personen eingestellt. Wenden Sie Ihren Biomarker-Test auf jeden an, sodass Sie eine Folge von Nullen und Einsen erhalten, die wir aufrufen . Die Einträge von haben eine Bernoulli-Verteilung mit Erfolgswahrscheinlichkeit . Die Schätzung von ist . Hoffentlich ist "groß" und Sie können die Genauigkeit Ihrer Schätzung anhand eines Konfidenzintervalls für beurteilen .n p p p^= ∑ x / n p^ p
x
x
Ihre Frage besagt, dass Sie wissen möchten, wie groß sein sollte. Um dies zu beantworten, müssen Sie in der Biomarker-Literatur nachlesen, wie groß "groß" ist und wie gering die Empfindlichkeit ist, die Sie aufgrund von Stichprobenfehlern tolerieren können. Angenommen, Sie entscheiden, dass ein Biomarker "gut" ist, wenn seine Empfindlichkeit größer als (was eigentlich nicht so gut ist), und Sie möchten, dass groß genug ist, damit eine 90% ige Chance besteht, eine Empfindlichkeit von zu erkennen . Angenommen, Sie möchten Ihr Signifikanzniveau auf .n p = 0,5 n p = 0,57 α = 0,05
Es gibt mindestens zwei Ansätze - Analyse und Simulation. Das
pwr
Paket in istR
bereits vorhanden, um bei diesem Entwurf zu helfen - Sie müssen es zuerst installieren. Als nächstes benötigen Sie eine Effektgröße, dann ist die gewünschte Funktionpwr.p.test
.Sie benötigen also ungefähr krebskranke Personen, um eine Empfindlichkeit von mit einer Leistung von wenn Ihr Signifikanzniveau beträgt . Ich habe auch den Simulationsansatz ausprobiert und er gibt eine ähnliche Antwort. Wenn die wahre Empfindlichkeit höher als (Ihr Biomarker ist besser), brauchen Sie natürlich weniger Leute, um sie zu erkennen.435 0,57 0,90 0,05 0,57
Sobald Sie Ihre Daten erhalten haben, können Sie den Test folgendermaßen ausführen (ich werde die Daten aus Gründen der Argumentation simulieren).
Die geschätzte Empfindlichkeit beträgt . Was wirklich zählt, ist das Konfidenzintervall für das in diesem Fall beträgt .0,568 p [ 0.527 , 1 ]
BEARBEITEN: Wenn Ihnen der Simulationsansatz besser gefällt, können Sie dies folgendermaßen tun: einstellen
und lass
runTest
seinDie Schätzung der Macht ist also
quelle