Ich arbeite derzeit an einer Möglichkeit, zwei verschiedene Phosphortestwerte ineinander umzuwandeln.
Hintergrund
Es gibt viele (Extraktions-) Methoden, um pflanzenverfügbaren Phosphor im Boden zu messen. Verschiedene Länder wenden unterschiedliche Methoden an. Um die P-Fertilität zwischen den Ländern zu vergleichen, muss der P-Testwert x auf der Grundlage des P-Testwerts y berechnet werden und umgekehrt. Daher sind Antwort und Kovariate austauschbar.
P-Menge in Extraktionsmittel 1 = P_CAL in [mg / 100 g Boden]
P-Menge in Extraktionsmittel 2 = P_DL in [mg / 100 g Boden]
Um eine solche "Transformationsgleichung" aufzustellen, wurde der P-Gehalt von 136 Bodenproben mit CAL- und DL-Extrakt analysiert. Zusätzliche Parameter wie der pH-Wert des Bodens, der gesamte organische Kohlenstoff, der gesamte Stickstoff, der Ton und das Carbonat wurden ebenfalls gemessen. Ziel ist es, ein einfaches Regressionsmodell abzuleiten. In einem zweiten Schritt auch ein Mehrfachmodell.
Um einen Überblick über die Daten zu geben, zeige ich Ihnen zwei Streudiagramme mit einer einfachen linearen (OLS) Regressionslinie.
Fragen:
Nach meinem Verständnis ist die Deming-Regression geeignet, wenn sowohl die Antwort- (y) als auch die erklärende (x) Variable (Mess-) Fehler aufweisen und austauschbar sind. Deming-Regression setzt voraus, dass das Varianzverhältnis bekannt ist. Gibt es eine andere Möglichkeit, das Varianzverhältnis zu bestimmen, da ich keine Details zur Genauigkeit von P-Extraktionsmessungen habe? Welche Varianz ist hier gemeint? Ich nehme an, es ist NICHT berechnet var(DL_P)/var(CAL_P)
?
Q1: Wie bestimme ich das Varianzverhältnis für die Deming-Regression?
Ein Sonderfall der Deming-Regression ist die orthogonale Regression. Es wird ein Varianzverhältnis = 1 angenommen.
F2: Gibt es eine Möglichkeit zu diagnostizieren, ob die Annahme δ = 1 "ungefähr" richtig ist oder ob die (falsche) Annahme hohe Vorhersagefehler mit sich bringt?
Wenn ich δ = 1 annehme, liefert die orthogonale Regression die folgende (gerundete) Ausgabe
library(MethComp)
deming <- Deming(y=P_CAL, x=P_DL, vr=1)
Achsenabschnitt: 0,75; Steigung: 0,71; Sigma P_DL: 3,17; Sigma P_CAL: 3.17
Das Auftragen der Deming-Regressionslinie in den obigen Darstellungen zeigt, dass die Deming-Regression der a) CAL-P = f (DL-P) -Regression sehr nahe kommt, sich jedoch stark von b) der DL-P = f (CAL-P) unterscheidet. Gleichung.
F3: Ist es richtig, dass in der orthogonalen Regression CAL-P = f (DL-P) und DL-P = f (CAL-P) mit derselben Gleichung ausgedrückt werden? Wenn nicht, wie leite ich korrekte Gleichungen für beide ab? Was vermisse ich hier?
Aufgrund der Eigenschaften beider Extraktionslösungen sind die DL-P-Werte tendenziell um 25% höher als die CAL-P-Werte, daher sollte CAL-P = f (DL-P) eine höhere Steigung aufweisen als DL-P = f (CAL) -P). Dies wird jedoch nicht in einer Deming-Regression ausgedrückt, wenn nur eine Steigung vorhanden ist. Was mich mit meiner letzten Frage zurücklässt.
F4: Ist Deming-Regression ein gültiger Ansatz für meinen Zweck?
quelle
Antworten:
Um einen Teil Ihrer Bedenken hier anzusprechen: Die Deming-Regression scheint eine schlechte Anpassung in Diagrammfeld B zu bieten, dies liegt jedoch daran, dass das Diagramm falsch ist. Eine schnelle Möglichkeit, um festzustellen, ob dies korrekt durchgeführt wurde, besteht darin, die X- und Y-Werte entlang der Deming-Regressionslinie zu betrachten. Für jeden DL-P-Wert in Feld A sollte es einen entsprechenden CAL-P-Wert haben, der in beiden Feldern identisch ist (NICHT wahr für OLS und den grundlegenden Unterschied zwischen ihnen). In diesen Darstellungen, in denen DL-P = 20 ist, beträgt CAL-P in Feld A ~ 15 und in Feld B ~ 27.
Der Fehler scheint zu sein, dass die Deming-Regressionslinie durch einfaches Vertauschen der CAL-P- und DL-P-Terme in der Gleichung gezogen wurde. Die Gleichung für Tafel A lautet:
Neuanordnung bedeutet, dass die Gleichung für Panel B lauten sollte:
Und nicht:
quelle