Für die Hausaufgaben erhielt ich Daten, um einen Prädiktor zu erstellen / zu trainieren, der die Lasso-Regression verwendet. Ich erstelle den Prädiktor und trainiere ihn mit der Lasso-Python-Bibliothek von scikit learn.
Jetzt habe ich diesen Prädiktor, der bei gegebener Eingabe die Ausgabe vorhersagen kann.
Die zweite Frage lautete: "Erweitern Sie Ihren Prädiktor, um das Konfidenzintervall der Vorhersage mithilfe der Bootstrapping-Methode zu melden."
Ich habe mich umgesehen und Beispiele von Leuten gefunden, die dies für den Mittelwert und andere Dinge tun.
Aber ich bin völlig verloren, wie ich es für eine Vorhersage tun soll. Ich versuche, die Scikit-Bootstrap- Bibliothek zu verwenden.
Das Kurspersonal reagiert extrem wenig, daher ist jede Hilfe willkommen. Vielen Dank.
Antworten:
Bootstrapping bezieht sich auf das erneute Abtasten Ihrer Daten durch Ersetzen. Das heißt, anstatt Ihr Modell an das ursprüngliche X und Y anzupassen, passen Sie Ihr Modell mehrmals an neu abgetastete Versionen von X und Y an.
Somit erhalten Sie n leicht unterschiedliche Modelle, mit denen Sie ein Konfidenzintervall erstellen können. Hier ist ein visuelles Beispiel für ein solches Intervall.
quelle
Wenn Sie die API von scikit für den Bootstrap-Teil des Codes verwenden möchten:
quelle