Experten! Vielleicht wissen Sie, wie man das Konfidenzintervall für xgboost berechnet? Eine klassische Formel mit T-Verteilung kann nicht helfen, da meine Daten nicht normal verteilt sind. Oder spielt das keine Rolle?
Wenn Sie Literatur vorschlagen, ist dies sehr nützlich, aber auch Ansätze in R und Python (im Kontext der Bibliothek xgb) sind gut.
Vielleicht sieht es aus wie das , aber wie es berechnen? Und fand dies - es ist richtig oder nicht?
PS: Ich kann leider keine Bilder hinzufügen, die mit meinen Daten zusammenhängen (Anzahl der Links).
confidence-interval
xgboost
Lu Wao
quelle
quelle
Antworten:
Das ist also die Antwort! ( Spiegel )
Um Konfidenzgrenzen für abnormal verteilte Daten zu erstellen, müssen Sie zunächst eine Quantilregression und nicht wie standardmäßig eine lineare Regression erstellen. Dazu ist es notwendig, die abgeleiteten Ableitungen aus dem Artikel zu verwenden oder einfach den Code auf die Python zu kopieren, um die Variable 'Ziel' anzupassen. Es ist auch notwendig, die Gradientenfunktion und die Gaußsche Funktion zu ändern. Nachdem alles programmiert ist, erstellen Sie eine Quantilregression für das 50. Quantil (dies ist die anfängliche Regression) und dann zwei Quantilregressionen für die beiden Grenzen des Intervalls (z. B. 95 und 5). Als Ergebnis erhalten Sie nicht nur ein genaueres Modell für die anfängliche Regression, sondern auch die gewünschten Intervalle.
quelle