Vollständige Offenlegung: Ich bin kein Statistiker und behaupte auch nicht, einer zu sein. Ich bin ein niedriger IT-Administrator. Bitte spiel sanft mit mir. :) :)
Ich bin für die Erfassung und Prognose der Festplattennutzung für unser Unternehmen verantwortlich. Wir erfassen unsere Speichernutzung monatlich und verwenden eine einfache rollierende zwölfmonatige lineare Regression für Prognosen (mit anderen Worten, bei der Erstellung einer Projektion werden nur die Daten der letzten zwölf Monate berücksichtigt). Wir verwenden diese Informationen für die Allokations- und Kapitalkostenplanung, z. B. "Basierend auf diesem Modell müssen wir x Betrag kaufen, wenn die Lagerung in y Monaten erfolgt, um unsere Anforderungen zu erfüllen." Dies alles funktioniert gut genug, um unseren Bedürfnissen zu entsprechen.
In regelmäßigen Abständen haben wir große einmalige Bewegungen in unseren Zahlen, die die Prognose verwerfen. Zum Beispiel findet jemand 500 GB alte Backups, die nicht mehr benötigt werden, und löscht sie. Gut für sie, um den Raum zurückzugewinnen! Unsere Prognosen sind jedoch jetzt durch diesen starken Rückgang in einem Monat weit verzerrt. Wir haben immer nur akzeptiert, dass ein solcher Rückgang 9 bis 10 Monate dauert, um aus den Modellen herauszukommen, aber das kann sehr lange dauern, wenn wir in die Planungssaison für Kapitalkosten eintreten.
Ich frage mich, ob es eine Möglichkeit gibt, mit diesen einmaligen Abweichungen umzugehen, sodass die prognostizierten Werte nicht so stark beeinflusst werden (z. B. ändert sich die Steigung der Linie nicht so dramatisch), aber sie werden berücksichtigt (z eine einmalige Änderung des y-Werts, der einem bestimmten Zeitpunkt zugeordnet ist). Unsere ersten Versuche, dies in Angriff zu nehmen, haben zu hässlichen Ergebnissen geführt (z. B. exponentielle Wachstumskurven). Wir führen die gesamte Verarbeitung in SQL Server durch, wenn dies wichtig ist.
quelle
Antworten:
Hier ist ein einfacher Vorschlag. Ich weiß nicht, ob es für Sie funktioniert, und vielleicht hätte ich es als Kommentar machen sollen, aber es scheint, dass Sie mehr Privilegien benötigen, um einen Kommentar abzugeben, als um eine Antwort zu geben.
Wenn ich das richtig verstehe, sind die Zahlen, die Sie verwenden, die Speichermengen, die Sie jeden Monat verwenden. Wahrscheinlich nehmen diese normalerweise zu, und Sie möchten vorhersagen, wie hoch der Betrag in Zukunft sein wird, wenn sich die Trends fortsetzen. Wenn Sie feststellen, dass Ihre große Änderung eingetreten ist (z. B. dass 500 GB freigegeben wurden), können Sie zurückgehen und die Zahlen der Vormonate ändern (z. B. 500 GB aus allen löschen)? Grundsätzlich würden Sie die Zahlen der Vormonate an das anpassen, was sie hätten sein sollen, wenn Sie damals wüssten, was Sie jetzt wissen.
Natürlich empfehle ich dies nur, wenn Sie sicherstellen, dass Sie zu den alten Zahlen zurückkehren können. Die Prognose, die Sie erstellen möchten, klingt jedoch so, als ob sie sogar in Excel erstellt werden könnte. In diesem Fall können Sie so viele Versionen haben, wie Sie möchten.
quelle