Wann wird die Deming-Regression verwendet?

9

Ich arbeite derzeit an einer Möglichkeit, zwei verschiedene Phosphortestwerte ineinander umzuwandeln.

Hintergrund

Es gibt viele (Extraktions-) Methoden, um pflanzenverfügbaren Phosphor im Boden zu messen. Verschiedene Länder wenden unterschiedliche Methoden an. Um die P-Fertilität zwischen den Ländern zu vergleichen, muss der P-Testwert x auf der Grundlage des P-Testwerts y berechnet werden und umgekehrt. Daher sind Antwort und Kovariate austauschbar.

P-Menge in Extraktionsmittel 1 = P_CAL in [mg / 100 g Boden]

P-Menge in Extraktionsmittel 2 = P_DL in [mg / 100 g Boden]

Um eine solche "Transformationsgleichung" aufzustellen, wurde der P-Gehalt von 136 Bodenproben mit CAL- und DL-Extrakt analysiert. Zusätzliche Parameter wie der pH-Wert des Bodens, der gesamte organische Kohlenstoff, der gesamte Stickstoff, der Ton und das Carbonat wurden ebenfalls gemessen. Ziel ist es, ein einfaches Regressionsmodell abzuleiten. In einem zweiten Schritt auch ein Mehrfachmodell.

Um einen Überblick über die Daten zu geben, zeige ich Ihnen zwei Streudiagramme mit einer einfachen linearen (OLS) Regressionslinie. a) Einfache OLS-Regression für CAL-P ~ DL-P, b) Einfache OLS-Regression für DL-P ~ CAL-P

Fragen:

Nach meinem Verständnis ist die Deming-Regression geeignet, wenn sowohl die Antwort- (y) als auch die erklärende (x) Variable (Mess-) Fehler aufweisen und austauschbar sind. Deming-Regression setzt voraus, dass das Varianzverhältnis bekannt ist. Gibt es eine andere Möglichkeit, das Varianzverhältnis zu bestimmen, da ich keine Details zur Genauigkeit von P-Extraktionsmessungen habe? Welche Varianz ist hier gemeint? Ich nehme an, es ist NICHT berechnet var(DL_P)/var(CAL_P)?

Q1: Wie bestimme ich das Varianzverhältnis für die Deming-Regression?

Ein Sonderfall der Deming-Regression ist die orthogonale Regression. Es wird ein Varianzverhältnis = 1 angenommen.

F2: Gibt es eine Möglichkeit zu diagnostizieren, ob die Annahme δ = 1 "ungefähr" richtig ist oder ob die (falsche) Annahme hohe Vorhersagefehler mit sich bringt?

Wenn ich δ = 1 annehme, liefert die orthogonale Regression die folgende (gerundete) Ausgabe

library(MethComp) deming <- Deming(y=P_CAL, x=P_DL, vr=1)

Achsenabschnitt: 0,75; Steigung: 0,71; Sigma P_DL: 3,17; Sigma P_CAL: 3.17

Das Auftragen der Deming-Regressionslinie in den obigen Darstellungen zeigt, dass die Deming-Regression der a) CAL-P = f (DL-P) -Regression sehr nahe kommt, sich jedoch stark von b) der DL-P = f (CAL-P) unterscheidet. Gleichung. Geben Sie hier die Bildbeschreibung ein

F3: Ist es richtig, dass in der orthogonalen Regression CAL-P = f (DL-P) und DL-P = f (CAL-P) mit derselben Gleichung ausgedrückt werden? Wenn nicht, wie leite ich korrekte Gleichungen für beide ab? Was vermisse ich hier?

Aufgrund der Eigenschaften beider Extraktionslösungen sind die DL-P-Werte tendenziell um 25% höher als die CAL-P-Werte, daher sollte CAL-P = f (DL-P) eine höhere Steigung aufweisen als DL-P = f (CAL) -P). Dies wird jedoch nicht in einer Deming-Regression ausgedrückt, wenn nur eine Steigung vorhanden ist. Was mich mit meiner letzten Frage zurücklässt.

F4: Ist Deming-Regression ein gültiger Ansatz für meinen Zweck?

Asugila
quelle
1
Das Verhältnis der beiden Standardabweichungen wird in der Deming-Regression angenommen, um zu entscheiden, wo die Senkrechte zur Linie fallen gelassen werden soll. Wenn das Verhältnis 1 ist, wird angenommen, dass die Varianzen gleich sind und der Abstand aus einem Winkel von 45 Grad gemessen wird. Sie können dieses Verhältnis nicht aus den Daten bestimmen.
Michael R. Chernick

Antworten:

2

Um einen Teil Ihrer Bedenken hier anzusprechen: Die Deming-Regression scheint eine schlechte Anpassung in Diagrammfeld B zu bieten, dies liegt jedoch daran, dass das Diagramm falsch ist. Eine schnelle Möglichkeit, um festzustellen, ob dies korrekt durchgeführt wurde, besteht darin, die X- und Y-Werte entlang der Deming-Regressionslinie zu betrachten. Für jeden DL-P-Wert in Feld A sollte es einen entsprechenden CAL-P-Wert haben, der in beiden Feldern identisch ist (NICHT wahr für OLS und den grundlegenden Unterschied zwischen ihnen). In diesen Darstellungen, in denen DL-P = 20 ist, beträgt CAL-P in Feld A ~ 15 und in Feld B ~ 27.

Der Fehler scheint zu sein, dass die Deming-Regressionslinie durch einfaches Vertauschen der CAL-P- und DL-P-Terme in der Gleichung gezogen wurde. Die Gleichung für Tafel A lautet:

CAL-P = 0,75 + 0,71 * DL-P

Neuanordnung bedeutet, dass die Gleichung für Panel B lauten sollte:

DL-P = (CAL-P - 0,75) / 0,71

Und nicht:

DL-P = 0,75 + 0,71 * CAL-P (was aufgetragen wurde)

mkt - Monica wieder einsetzen
quelle