Eine Möglichkeit, den Vergleich zweier Überlebenskurven zusammenzufassen, ist die Berechnung der Hazard Ratio (HR). Es gibt (mindestens) zwei Methoden, um diesen Wert zu berechnen.
- Logrank-Methode. Berechnen Sie im Rahmen der Kaplan-Meier-Berechnungen die Anzahl der beobachteten Ereignisse (normalerweise Todesfälle) in jeder Gruppe ( und ) und die Anzahl der erwarteten Ereignisse unter der Annahme einer Nullhypothese ohne Überlebensunterschied ( und ). . Das Gefährdungsverhältnis ist dann:
E a E b H R = ( O a / E a )
- Mantel-Haenszel-Methode. Berechnen Sie zunächst V, dh die Summe der hypergeometrischen Varianzen zu jedem Zeitpunkt. Dann berechnen Sie die Hazard Ratio als:
Ich habe diese beiden Gleichungen aus Kapitel 3 von Machin, Cheung und Parmar, Survival Analysis . In diesem Buch heißt es, dass die beiden Methoden in der Regel sehr ähnliche Methoden ergeben, und in der Tat ist dies beim Beispiel im Buch der Fall.
Jemand hat mir ein Beispiel geschickt, bei dem sich die beiden Methoden um den Faktor drei unterscheiden. In diesem speziellen Beispiel ist es offensichtlich, dass die Logrank-Schätzung sinnvoll ist und die Mantel-Haenszel-Schätzung weit entfernt ist. Meine Frage ist, ob jemand einen allgemeinen Rat hat, wann es am besten ist, die logarithmische Schätzung des Gefährdungsgrads zu wählen, und wann es am besten ist, die Mantel-Haenszel-Schätzung zu wählen. Hat es mit dem Stichprobenumfang zu tun? Anzahl der Krawatten? Verhältnis der Stichprobengrößen?
Antworten:
Ich denke, ich habe die Antwort herausgefunden (auf meine eigene Frage). Wenn die Annahme proportionaler Gefährdungen zutrifft, geben die beiden Methoden ähnliche Schätzungen der Gefährdungsquote. Die Diskrepanz, die ich in einem bestimmten Beispiel gefunden habe, liegt meiner Meinung nach an der Tatsache, dass diese Annahme zweifelhaft ist.
Wenn die Annahme proportionaler Gefahren wahr ist, sollte ein Diagramm von log (Zeit) vs. log (-log (St)) (wobei St das proportionale Überleben zum Zeitpunkt t ist) zwei parallele Linien zeigen. Unten sehen Sie das Diagramm, das aus dem Problemdatensatz erstellt wurde. Es scheint alles andere als linear zu sein. Wenn die Annahme proportionaler Gefährdungen nicht gültig ist, ist das Konzept einer Gefährdungsquote bedeutungslos und es spielt keine Rolle, mit welcher Methode die Gefährdungsquote berechnet wird.
Ich frage mich, ob die Diskrepanz zwischen den Schätzungen von Logrank und Mantel-Haenszel zur Gefährdungsquote als Methode zur Prüfung der Annahme proportionaler Gefährdungen herangezogen werden kann.
quelle
Wenn ich mich nicht irre, wird der Log-Rank-Schätzer, auf den Sie verweisen, auch als Pike-Schätzer bezeichnet. Ich glaube, es wird allgemein für HR <3 empfohlen, da es in diesem Bereich weniger Verzerrungen aufweist. Das folgende Papier ist möglicherweise von Interesse (beachten Sie, dass das Papier als O / E bezeichnet wird):
quelle
Tatsächlich gibt es mehrere weitere Methoden, und die Wahl hängt häufig davon ab, ob Sie am meisten daran interessiert sind, nach frühen oder späteren Unterschieden zu suchen, oder - wie beim Log-Rank-Test und beim Mantel-Haenszel-Test - allen Zeitpunkten das gleiche Gewicht zu geben.
Zur Frage zur Hand. Der Log-Rank-Test ist in der Tat eine Form des Mantel-Haenszel-Tests, der auf Überlebensdaten angewendet wird. Der Mantel-Haenszel-Test wird normalerweise verwendet, um die Unabhängigkeit in geschichteten Kontingenztabellen zu testen.
Wenn wir versuchen, den MH-Test auf Überlebensdaten anzuwenden, können wir davon ausgehen, dass die Ereignisse zu jeder Ausfallzeit unabhängig sind. Wir schichten dann nach Ausfallzeit. Wir verwenden die MH-Methoden, um jede Ausfallzeit zu einer Schicht zu machen. Es überrascht nicht, dass sie oft das gleiche Ergebnis liefern.
Die Ausnahme tritt auf, wenn mehr als ein Ereignis gleichzeitig eintritt - mehrere Todesfälle zum exakt gleichen Zeitpunkt. Ich kann mich nicht erinnern, wie sich die Behandlung dann unterscheidet. Ich denke, der Log-Rank-Test ergibt einen Durchschnitt über die möglichen Ordnungen der gebundenen Ausfallzeiten.
Der Log-Rank-Test ist also der MH-Test für Überlebensdaten und kann sich mit Bindungen befassen. Ich habe den MH-Test nie für Überlebensdaten verwendet.
quelle
Ich dachte, ich wäre über eine Website und einen Verweis gestolpert, die genau diese Frage behandeln:
http://www.graphpad.com/faq/viewfaq.cfm?faq=1226 Beginnen Sie mit "Die beiden Methoden im Vergleich".
Die Seite verweist auf das Berstein-Papier, auf das oben verwiesen wird:
http://www.jstor.org/stable/2530564?seq=1
Die Seite fasst die Ergebnisse von Berstein et al. Gut zusammen, also zitiere ich sie:
Die Site verweist auch auf den Datensatz, in dem "die beiden HR-Schätzungen sehr unterschiedlich waren (um den Faktor drei)", und legt nahe, dass die PH-Annahme eine Schlüsselüberlegung darstellt.
Dann dachte ich: "Wer hat die Seite verfasst?" Nach einigem Suchen stellte ich fest, dass es Harvey Motulsky war. Ich habe es also geschafft, Sie bei der Beantwortung Ihrer eigenen Frage zu referenzieren. Du bist die Autorität geworden!
Ist der "Problem-Datensatz" ein öffentlich verfügbarer Datensatz?
quelle