Ein Instrument zur Messung des Glukosespiegels im Blut einer Person wird an einer Zufallsstichprobe von 10 Personen überwacht. Die Werte werden auch unter Verwendung eines sehr genauen Laborverfahrens gemessen. Das Instrumentenmaß wird mit x bezeichnet. Die Laborprozedurmaßnahme ist mit y bezeichnet.
Ich persönlich denke, y auf x ist korrekter, weil die Absicht besteht, die Instrumentenablesungen zu verwenden, um die Laborablesungen vorherzusagen. Und y auf x minimiert die Fehler solcher Vorhersagen.
Aber die Antwort war x auf y.
[self-study]
Tag hinzu.Antworten:
Viele Laborarbeiten, insbesondere die Experimente zum Testen von Instrumenten, wenden eine solche x auf y-Regression an.
Sie argumentieren, dass aus der Datenerfassung im Experiment die y-Bedingungen gesteuert werden und x aus der Instrumentenablesung erhalten wird (was zu Fehlern führt). Dies ist das ursprüngliche physikalische Modell des Experiments, daher ist der x ~ y + -Fehler besser geeignet.
Um den Versuchsfehler zu minimieren, wird y manchmal unter denselben Bedingungen gesteuert, dann wird x mehrmals gemessen (oder es wird wiederholt experimentiert). Dieses Verfahren kann Ihnen helfen, die Logik dahinter zu verstehen und x ~ y + Fehler klarer zu finden.
quelle
quelle
Vorhersage und Prognose
Ja, Sie haben Recht. Wenn Sie dies als Vorhersageproblem betrachten, erhalten Sie durch eine Y-auf-X-Regression ein Modell, mit dem Sie bei einer Instrumentenmessung eine unvoreingenommene Schätzung der genauen Labormessung vornehmen können, ohne das Laborverfahren durchführen zu müssen .
Dies mag kontraintuitiv erscheinen, da die Fehlerstruktur nicht die "echte" ist. Unter der Annahme, dass die Labormethode eine fehlerfreie Goldstandardmethode ist, "wissen" wir, dass das wahre datengenerierende Modell ist
Explizit können wir ohne Verlust der Allgemeinheit lassen
Instrumentenanalyse
Die Person, die Ihnen diese Frage gestellt hat, wollte die obige Antwort eindeutig nicht, da sie sagt, dass X-auf-Y die richtige Methode ist. Warum haben sie das vielleicht gewollt? Höchstwahrscheinlich überlegten sie, das Instrument zu verstehen. Wie in Vincents Antwort besprochen, ist das X-on-Y der richtige Weg, wenn Sie wissen möchten, dass sich das Instrument verhält.
Zurück zur ersten Gleichung oben:
Schwindung
Beispiel in R Eine Möglichkeit, ein Gefühl dafür zu bekommen, was hier vor sich geht, besteht darin, einige Daten zu erstellen und die Methoden auszuprobieren. Der folgende Code vergleicht X-on-Y mit Y-on-X für die Vorhersage und Kalibrierung, und Sie können schnell erkennen, dass X-on-Y für das Vorhersagemodell nicht gut ist, aber das richtige Verfahren für die Kalibrierung.
Die beiden Regressionslinien sind über den Daten aufgetragen
Und dann wird die Summe der Fehlerquadrate für Y für beide Anpassungen an einer neuen Stichprobe gemessen.
Alternativ kann eine Stichprobe mit einem festen Y (in diesem Fall 4) erstellt und dann der Durchschnitt dieser Schätzungen ermittelt werden. Sie können jetzt sehen, dass der Y-on-X-Prädiktor mit einem erwarteten Wert, der viel niedriger als Y ist, nicht gut kalibriert ist. Der X-on-Y-Prädiktor ist mit einem erwarteten Wert nahe Y gut kalibriert.
Die Verteilung der beiden Vorhersagen ist in einem Dichtediagramm zu sehen.
quelle
Dies hängt von Ihren Annahmen über die Varianz von X und die Varianz von Y für gewöhnliche kleinste Quadrate ab. Wenn Y die einzige Varianzquelle hat und X die Varianz Null hat, verwenden Sie X, um Y zu schätzen. Wenn die Annahmen umgekehrt sind (X hat die einzige Varianz und Y hat die Varianz Null), verwenden Sie Y, um X zu schätzen.
Wenn angenommen wird, dass sowohl X als auch Y eine Varianz aufweisen, müssen Sie möglicherweise die Gesamtzahl der kleinsten Quadrate berücksichtigen .
Eine gute Beschreibung von TLS wurde unter diesem Link geschrieben . Das Papier ist auf den Handel ausgerichtet, aber Abschnitt 3 beschreibt TLS gut.
Bearbeiten 1 (09/10/2013) ========================================== ======
Ich nahm ursprünglich an, dass dies eine Art Hausaufgabenproblem war, daher wurde ich nicht wirklich spezifisch über die "Antwort" auf die Frage des OP. Aber nachdem Sie andere Antworten gelesen haben, scheint es in Ordnung zu sein, etwas detaillierter zu werden.
Zitat eines Teils der Frage des OP:
".... Die Werte werden auch mit einem sehr genauen Laborverfahren gemessen ...."
Die obige Aussage besagt, dass es zwei Messungen gibt, eine vom Instrument und eine vom Laborverfahren. Die Aussage impliziert auch, dass die Varianz für das Laborverfahren im Vergleich zur Varianz für das Instrument gering ist.
Ein weiteres Zitat aus der Frage des OP lautet:
".... Die Laborprozedurmaßnahme wird mit y bezeichnet ....."
Aus den beiden obigen Aussagen geht hervor, dass Y die geringere Varianz aufweist. Die am wenigsten fehleranfällige Technik besteht darin, Y zum Schätzen von X zu verwenden. Die "bereitgestellte Antwort" war korrekt.
quelle