Warum hat das Supremum der Brownschen Brücke die Kolmogorov-Smirnov-Verteilung?

Die Kolmogorov-Smirnov-Verteilung ist aus dem Kolmogorov-Smirnov-Test bekannt . Es ist jedoch auch die Verteilung des Supremums der Brownschen Brücke.

Da dies für mich alles andere als selbstverständlich ist, möchte ich Sie um eine intuitive Erklärung dieses Zufalls bitten. Referenzen sind ebenfalls willkommen.

distributions hypothesis-testing mathematical-statistics stochastic-processes Rasmus
quelle

@GaBorgulya: Was hast du geändert?

Rasmus

Sehen Sie hier und hier .

Kardinal

Antworten:

$\sqrt{n}\sup_x|F_n-F|=\sup_x|\frac{1}{\sqrt{n}}\sum_{i=1}^nZ_i(x)|$

wobei $Z_i(x)=1_{X_i\leq x}-E[1_{X_i\leq x}]$

nach CLT ist $G_n=\frac{1}{\sqrt{n}}\sum_{i=1}^nZ_i(x)\rightarrow \mathcal{N}(0,F(x)(1-F(x)))$

das ist die Intuition ...

Die Brownsche Brücke hat die Varianz http://en.wikipedia.org/wiki/Brownian_bridge Ersetze durch . Dies ist für eine ... $B(t)$ $t(1-t)$ $t$ $F(x)$ $x$

Sie müssen auch die Kovarianz überprüfen, und daher ist es immer noch leicht, (CLT) zu zeigen, dass für ( ) , wo ist mit $x_1,\dots,x_k$ $(G_n(x_1),\dots,G_n(x_k))\rightarrow (B_1,\dots,B_k)$ $(B_1,\dots,B_k)$ $\mathcal{N}(0,\Sigma)$ , . $\Sigma=(\sigma_{ij})$ $\sigma_{ij}=\min(F(x_i),F(x_j))-F(x_i)F(x_j)$

Der schwierige Teil ist zu zeigen, dass die Verteilung des Suppremums der Grenze das Supremum der Verteilung der Grenze ist ... Um zu verstehen, warum dies geschieht, ist eine empirische Prozesstheorie erforderlich, in der Bücher wie van der Waart und Welner (nicht einfach) gelesen werden. . Der Name des Theorems lautet Donsker Theorem http://en.wikipedia.org/wiki/Donsker%27s_theorem ...

Robin Girard
quelle

Sollten wir die CLT nicht auf alle endlichdimensionalen Randverteilungen anwenden?

Rasmus

Sie haben nach einer intuitiven Antwort gefragt :) Ich möchte Sie auch nicht mit dem schwierigen mathematischen Teil belästigen, der zeigt, dass die Konvergenz für alle die Konvergenz (im Gesetz) des Supremums impliziert Antworten ?

Robin Girard

Lieber Robin Girard, ich denke, deine Antwort ist in Ordnung, so wie sie ist. Vielen Dank!

Rasmus

Der schwierige Teil besteht darin, eine schwache Konvergenz zu zeigen. Die Konvergenz von Supremen folgt dann direkt aus dem kontinuierlichen Kartierungssatz. Dieses Ergebnis ist in Billingsleys "Convergence of Probability Measures" zu finden. Van der Vaart und Wellner geben allgemeinere Ergebnisse und ihr Buch ist wirklich sehr, sehr schwierig :)

mpiktas

@robingirard Ich persönlich würde gerne eine "vollständige Antwort" mit all den "kniffligen mathematischen Teilen" sehen

StatsPlease

Betrachten Sie für Kolmogorov-Smirnov die Nullhypothese. Es heißt, dass eine Stichprobe aus einer bestimmten Verteilung gezogen wird. Also, wenn Sie die empirische Verteilungsfunktion für konstruieren $n$ Proben $f(x) = \frac{1}{n} \sum_i \chi_{(-\infty, X_i]}(x)$ , in the limit of infinite data, it will converge to the underlying distribution.

For finite information, it will be off. If one of the measurements is $q$ , then at $x=q$ the empirical distribution function takes a step up. We can look at it as a random walk which is constrained to begin and end on the true distribution function. Once you know that, you go ransack the literature for the huge amount of information known about random walks to find out what the largest expected deviation of such a walk is.

You can do the same trick with any $p$ -norm of the difference between the empirical and underlying distribution functions. For $p=2$ , it's called the Cramer-von Mises test. I don't know the set of all such tests for arbitrary real, positive $p$ form a complete class of any kind, but it might be an interesting thing to look at.

user873
quelle