Um ehrlich zu sein, habe ich viele Websites und Antworten zu dieser Frage gelesen und keine hat sie in einfachen Worten erklärt, die verständlich sind. Ich möchte verstehen, was ein zufälliger Spaziergang bewirkt und wie er für die Gen-Set-Anreicherungsanalyse verwendet werden kann.
Es gibt hier ein veröffentlichtes Papier http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3205944/, aber ich konnte es nicht wirklich verstehen.
Kann jemand bitte in einfachen Worten erklären, was es tut?
Antworten:
Ich werde versuchen, Ihre erste Frage zu beantworten
Ein zufälliger Spaziergang ist eine Reihe von Messungen, bei denen der Wert an einem bestimmten Punkt in der Reihe der Wert des vorherigen Punkts in der Reihe zuzüglich einer zufälligen Menge ist.
Angenommen, Sie werfen eine faire Münze in einer Reihe von Würfen und jedes Mal, wenn die Münze auftaucht, addieren Sie 1 zum vorherigen Wert Ihrer seriellen Variablen, und jedes Mal, wenn die Münze auftaucht, subtrahieren Sie 1 vom vorherigen Wert Ihrer seriellen Variablen. Wenn der Startwert 0 ist und Sie die folgende Folge von Münzwürfen umdrehen:
Die Verteilung von hängt von der Zeit und gibt einer Stichprobe von über verschiedene Zeiten einige interessante Eigenschaften :y t y
Der Mittelwert von ist undefiniert.y Dies mag kontraintuitiv erscheinen, da Sie erwarten können, dass Kopf und Zahl einer ausgeglichenen Münze auf Null zentriert sind. Dies gilt soweit es geht, aber Null war nur ein beliebiger Startwert von . y Es gibt also keinen wirklichen Mittelwert!
Die Varianz von .y=t Mit zunehmender Zeit (Anzahl der Flips) nimmt auch die Varianz zu. Zum Beispiel sind beim ersten Flip ( ) die möglichen Werte oder , und tatsächlich ist die Varianz dann 1. Beim zweiten Flip ( ) sind die möglichen Werte , oder und die Varianz ist gleich 2. Für eine unendliche Anzahl von Flips (bei , wenn der Bereich aller möglichen Werte von von bis ) ist die Varianz unendlich.t=1 1 −1 t=2 2 0 −2 t=∞ y −∞ ∞
Diese beiden Tatsachen wirken sich verheerend auf den Versuch aus, Rückschlüsse auf die Verteilung von (anstelle von für ein gegebenes ) zu ziehen, wenn nur eine Stichprobe verwendet wird, wenn die grundlegenden Werkzeuge der statistischen Inferenz verwendet werden. (Wie kann ein endlicher undefiniert schätzen ? Wie kann ein endlicher schätzen ?)y yt y0 y¯ s2y σ2y=∞
Es gibt viele Arten von zufälligen Spaziergängen und allgemeiner von autogregressiven Prozessen (dh jede Variable, die in irgendeiner Weise von ihren vorherigen Werten abhängt). Das Beispiel hier verwendet eine einfache Bernouli-Zufallsvariable (den Münzwurf), aber man könnte:
Aber sie sind alle Dickens, die versuchen, mit den grundlegenden Methoden zu analysieren. Aus diesem Grund verfügen wir über integrierte Regressions- und Fehlerkorrekturmodelle sowie andere Zeitreihenanalysetechniken für den Umgang mit dieser Art von Daten (die wir unter anderen Bezeichnungen manchmal als "nicht integriert", "lange gespeichert" oder "Einheitswurzel" bezeichnen , abhängig von den Details).
Der Ursprung des Begriffs "Random Walk" liegt in zwei sehr kurzen Briefen an die Natur aus dem Jahr 1905.
Literaturhinweise
Pearson, K. (1905). Briefe an den Herausgeber: Das Problem des zufälligen Spaziergangs. Nature , 72 (1865): 294.
Pearson, K. (1905). Briefe an den Herausgeber: Das Problem des zufälligen Spaziergangs. Nature , 72 (1867): 342.
quelle