Wo soll ich anfangen?: Zeitreihen mit ungleichmäßigen Abständen, mit vielen Ausreißern oder Zufälligkeiten

Ich weiß nicht genau, was möglich ist, und möchte einen Zeiger in die richtige Richtung.

Ich habe Zeit- und Positionsmessungen, die von einer Person, die läuft, einem Fahrzeug auf einer Straße, einem Parkplatz oder einem Drucker in einem Büro stammen können. Ich muss die Fahrzeiten für Fahrzeuge zwischen zwei Punkten berechnen. Es kann sein, dass sie eine mäandrierende Route nehmen oder sogar Tage brauchen, um von A nach B zu gelangen. Oder sie können Fußgänger oder Rettungsfahrzeuge sein.

Ich möchte die geschätzte Fahrzeit für ein normales Fahrzeug entlang der Hauptstrecke.

Die Erkennungen erfolgen immer dann, wenn sich jemand in der Nähe des Detektors befindet, der einen bestimmten Radius hat. Manchmal gibt es nur sehr wenige Erkennungen, was wahrscheinlich bedeutet, dass die Straße leer ist und die Reisezeit gut wäre, obwohl dies bedeuten könnte, dass die Straße gesperrt ist und die Reisezeit schrecklich wäre. Oder es kann viele Erkennungen geben, die darauf hinweisen, dass sich der Verkehr nicht bewegt, und es könnte eine Warteschlange sein, um die Straße abzubiegen, aber andere Fahrzeuge fahren mit normaler Geschwindigkeit.

Die Diagramme sehen aus wie zufälliges Rauschen.

BEARBEITEN:

Im Moment betrachte ich zwei Methoden:

Verwenden Sie den Interquartilbereich, um Ausreißer zu verwerfen
Verwenden Sie einen Kalman-Filter.

Ich denke, der Filter ist der falsche Weg, da ich kein anderes Modell für die Reisezeit habe als von Moment zu Moment. Ich erwarte nicht, dass sich daran viel ändert.

time-series kalman-filter unevenly-spaced-time-series Peter Wood
quelle

Dies sieht aus wie eine Arbeit, die ein methodisches Papier in Annals of Applied Statistics und ein inhaltliches Papier in Journal of Transportation Research erfordert . Sie sollten nicht erwarten, dass die Community beide Artikel weder in den Antworten noch in den Kommentaren für Sie schreibt, und Sie möchten lieber die Zusammenarbeit eines Transportstatistikers oder -ökonomen suchen. Oder werfen Sie dies einem Doktoranden in Statistik oder Wirtschaftswissenschaften als Dissertationsthema zu.

StasK

@StasK Ich hatte nicht erwartet, dass die Community Papiere für mich schreibt, ich bat um Hinweise in die richtige Richtung. Vielen Dank, dass Sie mich wissen lassen, dass dies ein erhebliches Unterfangen ist.

Peter Wood

Ich denke es ist, das ist alles was ich sagen wollte. Wenn Sie ungleichmäßige Zeitintervalle haben, sollten Sie Variogrammmodellierung und Kriging verwenden, die im Allgemeinen als räumliche Statistikwerkzeuge betrachtet werden.

StasK

@StasK Ich glaube nicht, dass Kriging und Variogramme das sind, was ich brauche. Die Geometrie der Route zwischen zwei Punkten ist relativ unbekannt und für die Art der gewünschten Ergebnisse unwichtig. Wir haben zwei Punkte mit Erkennungen an jedem Punkt und viele falsche Reiseerkennungen. Wir möchten den Lärm herausfiltern und eine gute Schätzung der aktuellen und historischen Straßenverhältnisse erhalten. Vielen Dank für Ihr Interesse.

Peter Wood

Ich weiß nicht, ob ich Ihnen eine erwartete Antwort geben kann, aber ich denke, ein Bayes'scher Ansatz wäre in diesem Fall gut.

Vielleicht möchten Sie einen Blick auf Partikelfilter anstatt auf Kalman werfen, da es in diesem Fall möglicherweise ein Problem ist, das richtige Modell für den Kalman-Filter einzurichten. Wenn Sie sich für Kalman entscheiden möchten, gibt es verschiedene Filtertypen, von denen einige gute Kenntnisse über die Fehlerkovarianz erfordern, was zu Problemen führen kann, andere können sie jedoch mit Mante Carlo berechnen. Schauen Sie sich den nicht parfümierten Kalman-Filter an.

Möglicherweise gefällt Ihnen auch http://www.udacity.com/overview/Course/cs373/CourseRev/apr2012, da hier einige grundlegende Informationen zur Schätzung des fahrenden Fahrzeugs und des selbstfahrenden Autos von Google erläutert werden. (und es ist in Python).

Vielleicht wären einige weitere Details in Ihrer Frage hilfreicher und Sie können genauere Antworten erhalten.

tomasz74
quelle

Wo soll ich anfangen?: Zeitreihen mit ungleichmäßigen Abständen, mit vielen Ausreißern oder Zufälligkeiten

Antworten: