Ich finde, dass Bland-Altman-Diagramme zum Vergleich zweier Methoden bei der Beurteilung der Übereinstimmung äußerst nützlich sind. Ich bin jedoch gespannt, ob es eine ähnliche Methode oder Transformation gibt, die verwendet werden kann, wenn die Skalen der beiden Methoden nicht identisch sind, aber dennoch dasselbe zugrunde liegende Phänomen messen.
Zum Beispiel versuche ich, die Übereinstimmung zwischen zwei Methoden zu vergleichen, die beide den Proteingehalt messen: quantitativer Western Blot und Tryptophanfluoreszenz. Jedes gibt eine ganz andere Art der Messung an, aber es ist immer noch vernünftig zu hinterfragen, wie gut sie bei der Messung des Proteingehalts übereinstimmen.
Meine Frage: Gibt es eine Methode ähnlich einer Bland-Altman-Darstellung (auch als Tukey-Mean-Difference-Darstellung bekannt), die verschiedene Skalen verarbeiten kann? Mein einziger Gedanke war, eine Spearman-Korrelation zu verwenden, um die relative Reihenfolge der Proben zu vergleichen, aber Korrelationen sind mit Gefahren behaftet . Vielen Dank für alle Antworten.
Antworten:
Das Problem mit Korrelationen als Maß an Übereinstimmung besteht darin , dass , was sie wirklich beurteilen die Reihenfolge der ist und Werte und der relativen Abstand, aber nicht , dass die Zahlen sich einig (vgl siehe meine Antwort hier: Does Spearman zeigt Übereinstimmung an? ). Wenn die Zahlen jedoch nicht angemessen sind, macht es keinen Sinn, festzustellen, ob sie übereinstimmen - es kann nichts bedeuten, ob sie es tun oder nicht. Infolgedessen kann ein Bland-Altman-Plot hier keinen Wert haben. Eine Korrelation könnte jedoch einen gewissen (wenn auch geringen) Wert bieten.X.ich Y.ich r = 0,38
Aus explorativer Sicht würde ich mit einem regulären, alten Streudiagramm beginnen. Ich könnte auch eine einfache lineare Regression durchführen und die Krümmung in der Beziehung testen. Es kann häufig vorkommen, dass unterschiedliche Maßnahmen in unterschiedlichen Bereichen unterschiedlich empfindlich sind. Zum Beispiel können sie genauso gut messen, was Sie in der Mitte ihres Bereichs wollen, aber einer kann bessere Werte besser messen (während der andere gerade anfängt, dieselbe niedrige Zahl auszugeben, möglicherweise eine Nachweisgrenze). und umgekehrt für höhere Werte. Was ich vorhabe ist, dass die Beziehungen nicht linear sind. Betrachten Sie diese stilisierte Figur der Beziehung zwischen Energie und Wassertemperatur:
Stellen Sie sich dann vor, Sie hätten Temperatur und etwas anderes, vielleicht Volumen (Eis beginnt sich bei niedrigeren Temperaturen auszudehnen), beides als Maß für die Energie.
Sobald Sie davon überzeugt waren, dass die Beziehung linear ist, ist Ihre Fähigkeit, den Grad der Übereinstimmung zu messen, auf die Produkt-Moment-Korrelation von Pearson beschränkt. Bland-Altman-Pläne funktionieren hier einfach nicht.
quelle
Angenommen, Sie können nicht beide Kennzahlen in einen gemeinsamen Satz von Einheiten konvertieren, und beide Kennzahlen sind kontinuierlich und grob normalverteilt, konvertieren Sie beide in standardisierte Bewertungen (z.z=x - μσ ).
Als Antwort auf @Nick hinzugefügt: Bland-Altman-Diagramme zeichnen die Differenz zwischen zwei Kennzahlen gegen den Durchschnitt der beiden Kennzahlen auf. Um sinnvoll zu sein, müssen die beiden Kennzahlen auf derselben Skala gemessen werden. Wenn Sie zwei Kennzahlen mit unterschiedlichen Maßstäben in dimensionslose standardisierte Scores konvertieren, können Sie die erforderlichen Berechnungen durchführen.
Als Antwort auf @Nick (2) hinzugefügt:
Ich bin mir nicht sicher, was du sagst. Hier ist ein praktikables Beispiel:
Es erzielt das gleiche (zumindest in der Form) Ergebnis wie der
lm
von @Ashe verwendete Ansatz, was Sie erwarten würden, da beide Methoden die Werte neu skalieren.quelle
Ich habe eine mögliche Lösung gefunden, also werde ich versuchen, meine eigene Frage zu beantworten. Ich hätte gerne ein kritisches Feedback von der Community.
Ich weiß, dass die beiden Phänomene zusammenhängen, daher gehe ich davon aus, dass ich eine Skala auf die andere kalibrieren kann. Ich werde dann die Übereinstimmung zwischen den vorhergesagten Werten einer Methode mit den experimentellen Werten der anderen Methode vergleichen. Diese Methode kann immer noch keine Verzerrung der Mittelwerte finden (wie @Jeremy hervorhob, ist dies in diesem Zusammenhang nicht sinnvoll), ermöglicht jedoch möglicherweise einen Vergleich der 95% -Limits.
Ein Code (in R) zum Vergleichen:
Wenn ich versuche direkt zu vergleichenx und y Wie erwartet bekomme ich eine sehr schlechte Übereinstimmung:
Wenn ich jedoch die "kalibriere"x Werte zum y Bei Verwendung eines linearen Modells erscheint die Übereinstimmung viel besser:
Einige Schlüsselgedanken:
Wenn ich ein vernünftiges Modell (Nr. 1) ausgewählt habe, um eine Skala mit einer anderen zu kalibrieren (Nr. 3), kann ich die Residuen dieses Modells (Nr. 2) als Maß für die Übereinstimmung angemessen vergleichen. In der zweiten Beispielgrafik oben würde ich dies so interpretieren, dass 95% aller Abweichungen innerhalb von ~ 20 Punkten auf dem liegeny Rahmen. Ich kann dann bewerten, ob diese Grenzwerte für die beiden Methoden, die ich zu studieren versuche, angemessen sind.
Wie ich bereits sagte, sind Kritikpunkte willkommen.
quelle