Das zugrunde liegende Modell von PLS ist, dass eine gegebene Matrix X und n gegebener Vektor y durch X = T P ' + E , y = T q ' + f , wobei T eine latente n × k- Matrix ist, und E , in Beziehung stehen. f sind Rauschausdrücke (vorausgesetzt, X , y sind zentriert).
PLS erzeugt Schätzungen der , und A 'Abkürzung' Vektor der Regressionskoeffizienten, ß , so daß y ~ X β . Ich möchte die Verteilung finden β unter einigen vereinfachenden Annahmen, die die folgende wahrscheinlich enthalten sollte:
- Das Modell ist korrekt, dh für unbekanntes T , P , q ;
- Die Anzahl der latenten Faktoren ist bekannt und wird im PLS-Algorithmus verwendet.
- Die tatsächlichen Fehlerterme sind iid Null-Mittelwert-Normal mit bekannten Abweichungen;
Diese Frage ist etwas unterdefiniert, da es Dutzende von Varianten des PLS-Algorithmus gibt, aber ich würde Ergebnisse für jede von ihnen akzeptieren. Ich würde akzeptieren auch Hinweise, wie die Verteilung von abzuschätzen β über zB ein Bootstrap, aber das ist vielleicht eine andere Frage.