Ich versuche, Python und Sklearn zu lernen, aber für meine Arbeit muss ich Regressionen ausführen, die Fehlerverteilungen aus den Familien Poisson, Gamma und insbesondere Tweedie verwenden.
Ich sehe nichts in der Dokumentation darüber, aber sie befinden sich in mehreren Teilen der R-Distribution. Ich habe mich gefragt, ob jemand irgendwo Implementierungen für Python gesehen hat. Es wäre besonders cool, wenn Sie mich auf SGD-Implementierungen der Tweedie-Distribution hinweisen könnten!
Antworten:
Es gibt Bewegung , verallgemeinerte lineare Modelle mit Poisson-, Gamma- und Tweedie-Fehlerverteilungen in Scikit-Learn zu implementieren.
Statsmodels implementiert verallgemeinerte lineare Modelle mit Poisson-, Tweedie- und Gammafehlerverteilungen .
Während ich diese Antwort aktualisiere, unterstützt Spark ML (experimentell) auch Poisson-, Tweedie- und Gamma-Verteilungen.
quelle
H2O hat verallgemeinerte lineare Modelle .
Sie verwenden jedoch H2O-Frames, sodass Sie Pandas / Numpy nicht direkt verwenden können.
quelle