Ich versuche, Sätze von kausal verbundenen Zufallsvariablen zu generieren und habe dies mit einem Monte-Carlo-Ansatz begonnen.
Die Basislinie ist ein zweidimensional gemessenes Histogramm, aus dem ich zufällige Werte ziehe.
In meinen konkreten Beispielen sind diese Variablen Beschleunigung und Geschwindigkeit - also muss offensichtlich gelten.v v i + 1 = v i + a i ∗ d t
Mein derzeit naiver Ansatz ist:
Ich beginne mit einem . Dann generiere ich ein zufälliges gemäß der gemessenen Wahrscheinlichkeit von für den Wert von . Mit diesem kann ich berechnen und der gesamte Vorgang beginnt von vorne.a 0 a v 0 a 0 v 1
Wenn ich also die generierten Beschleunigungen in Bins von überprüfe, ist alles in Ordnung. Aber ich respektiere dies offensichtlich überhaupt nicht die marginale Verteilung von .v v
Ich bin ein bisschen mit den grundlegenden Monte-Carlo-Methoden vertraut, obwohl mir, wie Sie vielleicht erraten haben, ein theoretischer Hintergrund fehlt. Es wäre in Ordnung, wenn die beiden Variablen nur durch eine Korrelationsmatrix verbunden wären , aber der kausale Zusammenhang zwischen den beiden bereitet mir Kopfschmerzen.
Ich habe es nicht geschafft, irgendwo ein Beispiel für diese Art von Problem zu finden - ich könnte die falschen Begriffe googeln. Ich wäre zufrieden, wenn mich jemand auf eine Literatur / ein Beispiel oder eine vielversprechende Methode hinweisen könnte, um dies in den Griff zu bekommen.
(Oder sag mir, dass das angesichts meiner Eingaben nicht wirklich möglich ist - das schätze ich gelegentlich ...)
BEARBEITEN:
Das eigentliche Ziel dieses gesamten Verfahrens: Ich habe eine Reihe von Messungen und , die in einem zweidimensionalen Histogramm . Angesichts dieser Eingabe möchte ich zufällige Mengen von und generieren , die die gemessene Verteilung reproduzieren.v N ( a , v ) a r v r
quelle
Antworten:
Es scheint, dass Sie, um die gemeinsame Verteilung zu reproduzieren , neues nicht nur basierend auf auswählen sollten , sondern auch basierend auf dem alten auch:a v aρ(a,v) a v a
Die Frage (auf die ich die Antwort noch nicht kenne) ist, wie man , das . ρρ′ ρ
UPD: Sie müssen die folgende Integralgleichung lösen:
Wenn Sie die Funktion mit einem Histogramm approximieren , wenden Sie dies einem linearen Gleichungssystem zu:ρ
Dieses System ist unterbestimmt. Sie können eine Glättungsstrafe anwenden, um eine Lösung zu erhalten.
quelle
Enthalten die GPS-Daten nicht die Position ? Ich hätte gedacht, dass nicht nur von und abhängig ist, sondern auch von . Bedenken Sie: In jedem Straßennetz gibt es Engpässe, Geschwindigkeitsbegrenzungen, Signale, Kreuzungen, steile Gefälle usw., die geolokalisiert sind. So etwas wie ein Ensemble (Vertrieb) definiert durch:v i + 1 v i a i a i + 1 p ip vi+1 vi ai ai+1 pi
v i + 1 = v i + a i d tFa=Pr(Ai+1≤ai+1 | ai,vi,pi)
vi+1=vi+aidt
Für ein solches Ensemble liegt die Schwierigkeit in der Art der Daten. Es ist wahrscheinlich, dass die wahre Population asymmetrisch, nicht linear (stückweise) ist und möglicherweise keine definierten Momente aufweist. Diese Eigenschaften sind in der vorliegenden Probe möglicherweise nicht erkennbar.
Wie @whuber festgestellt hat, scheint das Problem, dh genau das, was Sie produzieren möchten, noch nicht vollständig und klar definiert zu sein. Es ist nicht klar, ob Sie sich für das Ensemble oder mehr für die Einzelpersonen interessieren.
quelle