Als «linear-model» getaggte Fragen

12
Wie führt man eine Imputation von Werten in einer sehr großen Anzahl von Datenpunkten durch?

Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...

12
Möglich, GLM in Python / Scikit-Learn mit den Poisson-, Gamma- oder Tweedie-Verteilungen als Familie für die Fehlerverteilung zu bewerten?

Ich versuche, Python und Sklearn zu lernen, aber für meine Arbeit muss ich Regressionen ausführen, die Fehlerverteilungen aus den Familien Poisson, Gamma und insbesondere Tweedie verwenden. Ich sehe nichts in der Dokumentation darüber, aber sie befinden sich in mehreren Teilen der R-Distribution....

11
Normalitätsannahme bei linearer Regression

Als Annahme einer linearen Regression wird die Normalität der Fehlerverteilung manchmal fälschlicherweise "erweitert" oder als Notwendigkeit der Normalität von y oder x interpretiert. Ist es möglich, ein Szenario / einen Datensatz zu erstellen, bei dem X und Y nicht normal sind, der Fehlerterm...