Ich habe einen Datensatz mit Daten zu Temperatur, Niederschlag und Sojabohnenerträgen für einen Betrieb für 10 Jahre (2005 - 2014). Basierend auf diesen Daten möchte ich die Renditen für 2015 vorhersagen.
Bitte beachten Sie, dass der Datensatz TÄGLICHE Werte für Temperatur und Niederschlag enthält, jedoch nur 1 Wert pro Jahr für den Ertrag, da die Ernte am Ende der Vegetationsperiode der Ernte erfolgt.
Ich möchte eine Regression oder ein anderes auf maschinellem Lernen basierendes Modell erstellen, um die Erträge für 2015 vorherzusagen, basierend auf einer Regression / einem anderen Modell, das aus der Untersuchung der Beziehung zwischen Erträgen und Temperatur und Niederschlag in früheren Jahren abgeleitet wurde.
Ich bin mit maschinellem Lernen mit Scikit-Learn vertraut. Ich bin mir jedoch nicht sicher, wie ich dieses Problem darstellen soll. Der schwierige Teil hier ist, dass Temperatur und Niederschlag täglich sind, aber der Ertrag nur 1 Wert pro Jahr beträgt.
Wie gehe ich das an?
quelle
Antworten:
Für den Anfang können Sie den Ertrag für das kommende Jahr anhand der täglichen Daten für das Vorjahr vorhersagen. Sie können die Modellparameter schätzen, indem Sie den Datenwert jedes Jahres als einen "Punkt" betrachten und das Modell dann mithilfe einer Kreuzvalidierung validieren. Sie können dieses Modell erweitern, indem Sie mehr als das vergangene Jahr berücksichtigen. Wenn Sie jedoch zu weit zurückblicken, haben Sie Probleme, Ihr Modell und Ihre Überanpassung zu validieren.
quelle
sklearn.cross_validation
Methoden mit "Label" im Namen verwenden, z. B. sklearn.cross_validation.LabelKFold .Sie können das Bayesian Belief Network zur Vorhersage verwenden. Sie ist ein Link zur grundlegenden Erklärung. Bayesianisches Netzwerk
quelle
Sie haben 10 Datenpunkte, wobei jeder Datenpunkt 365 (Temperatur für jeden Tag) + 365 (Niederschlag für jeden Tag) Dimensionen hat. Idealerweise würde ich zuerst die Dimensionen durch maschinelles Lernen reduzieren, z. B. PCA. Verwenden Sie dann Methoden des maschinellen Lernens, um ein Vorhersagemodell zu erstellen. Aufgrund des kleinen Datensatzes denke ich jedoch nicht, dass Techniken des maschinellen Lernens für Ihr Problem geeignet sind.
quelle