Angenommen, wir haben Punkte in einem Rechteck mit gebundenen , und diese Punkte sind in dieser Ebene gleichmäßig verteilt. (Ich bin mit Statistiken nicht ganz vertraut, daher kenne ich den Unterschied zwischen der einheitlichen Auswahl eines Knotens im Bereich oder der einheitlichen Auswahl der Achse aus und Achse von unabhängig).
Bei einer Entfernungsschwelle möchte ich vielleicht wissen , mit welcher Wahrscheinlichkeit die euklidische Entfernung von zwei Punkten kleiner als , oder genauer gesagt, wie viele Knotenpaare sind kleiner als ?
Vielleicht wäre die folgende Beschreibung eindeutig.
Lassen Sie mich dieses Problem spezifizieren. Gegeben Knoten und Schwelle . Diese Punkte sind gleichmäßig in einem Rechteck . Bezeichnen Sie eine Zufallsvariable als die Anzahl der Punktpaare innerhalb des Abstands . Finde .
quelle
probability
.Antworten:
Wir können dieses Problem mithilfe einiger geometrischer Intuition und Argumente analytisch lösen . Leider ist die Antwort ziemlich lang und etwas chaotisch.
Grundeinstellung
Lassen Sie uns zunächst eine Notation festlegen. Angenommen, wir zeichnen Punkte gleichmäßig zufällig aus dem Rechteck . Wir nehmen ohne Verlust der Allgemeinheit an, dass . Sei die Koordinate des ersten Punktes und die Koordinate des zweiten Punktes. Dann sind , , und voneinander unabhängig, wobei gleichmäßig auf und gleichmäßig auf .[0,a]×[0,b] 0<b<a (X1,Y1) (X2,Y2) X1 X2 Y1 Y2 Xi [0,a] Yi [0,b]
Betrachten Sie den euklidischen Abstand zwischen den beiden Punkten. Dies ist wobeiund.Z 1 = | X 1 - X 2 | Z 2 = | Y 1 - Y 2 |
Dreiecksverteilungen
Da und unabhängige Uniformen sind, hat eine dreieckige Verteilung, woraushat eine Verteilung mit der Dichtefunktion Die entsprechende Verteilungsfunktion ist für . In ähnlicher Weise isthat die Dichte und die Verteilungsfunktion .X 2 X 1 - X 2 Z 1 = | X 1 - X 2 | f a ( z 1 ) = 2X1 X2 X1−X2 Z1=|X1−X2| F a (
Beachten Sie, dass seit eine Funktion nur von den beiden ist und ist nur eine Funktion der , dann und sind unabhängig. Der Abstand zwischen den Punkten ist also die euklidische Norm zweier unabhängiger Zufallsvariablen (mit unterschiedlichen Verteilungen).X i Z 2 Y i Z 1 Z 2Z1 Xi Z2 Yi Z1 Z2
Das linke Feld der Abbildung zeigt die Verteilung von und das rechte Feld zeigtDabei ist in diesem Beispiel.Z 1 = | X 1 - X 2 | a = 5X1−X2 Z1=|X1−X2| a=5
Eine geometrische Wahrscheinlichkeit
So und sind unabhängig und werden auf unterstützte und ist. Für festes lautet die Verteilungsfunktion des euklidischen AbstandsZ1 Z2 [0,a] [0,b] d
Wir können uns dies geometrisch als eine Verteilung auf dem Rechteck und einen Viertelkreis mit dem Radius . Wir möchten die Wahrscheinlichkeit kennen, die innerhalb des Schnittpunkts dieser beiden Regionen liegt. Es gibt drei verschiedene Möglichkeiten:d[0,a]×[0,b] d
Region 1 (orange): . Hier liegt der Viertelkreis vollständig innerhalb des Rechtecks.0≤d<b
Region 2 (rot): . Hier schneidet der Viertelkreis den Rechteck entlang der Ober- und Unterkante.b≤d≤a
Region 3 (blau): . Der Viertelkreis schneidet das Rechteck am oberen und rechten Rand.a<d≤a2+b2−−−−−−√
Hier ist eine Abbildung, in der wir einen Beispielradius für jeden der drei Typen zeichnen. Das Rechteck ist definiert durch , . Die Graustufen-Heatmap innerhalb des Rechtecks zeigt die Dichte wobei dunkle Bereiche eine höhere Dichte und hellere Bereiche eine geringere Dichte aufweisen. Durch Klicken auf die Abbildung wird eine größere Version davon geöffnet.b = 4 f a ( z 1 ) f b ( z 2 )a=5 b=4 fa(z1)fb(z2)dz1dz2
Ein hässlicher Kalkül
Um die Wahrscheinlichkeiten zu berechnen, müssen wir einige Berechnungen durchführen. Betrachten wir nacheinander jede Region und sehen, dass ein gemeinsames Integral entsteht. Dieses Integral hat eine geschlossene Form, obwohl es nicht sehr hübsch ist.
Region 1 : .0≤d<b
Das innere Integral ergibt nun . Wir müssen also ein Integral der Form berechnen wobei in diesem Fall von Interesse . Das Antiderivativ des Integranden ist1a2d2−y2−−−−−−√(2a−d2−y2−−−−−−√)
Daraus ergibt sich .P(D≤d)=2a2b2(G(d)−G(0))
Region 2 : .b≤d≤a
Region 3 : .a<d≤a2+b2−−−−−−√
Im Folgenden finden Sie eine Simulation von 20000 Punkten, in der wir die empirische Verteilung als graue Punkte und die theoretische Verteilung als Linie darstellen, die entsprechend der jeweiligen Region gefärbt ist.
Aus derselben Simulation zeichnen wir unten die ersten 100 Punktepaare und zeichnen Linien zwischen ihnen. Jedes ist entsprechend dem Abstand zwischen dem Punktpaar und dem Bereich, in den dieser Abstand fällt, gefärbt.
Die erwartete Anzahl von Punktpaaren innerhalb des Abstands ist einfach durch Linearität der Erwartung.E [ ξ ] = ( nd
quelle
Wenn die Punkte wirklich gleichmäßig verteilt sind, dh in einem festen bekannten Muster, können Sie für jede Entfernung d einfach alle Paare durchlaufen und diejenigen innerhalb der Entfernung zählen. Ihre Wahrscheinlichkeit ist (diese Zahl / n).
Wenn Sie die zusätzliche Freiheit haben, auszuwählen, wie die n Punkte verteilt / ausgewählt werden, ist dies die rechteckige Version des Bertrand-Paradoxons . Diese Seite zeigt eine Reihe von Möglichkeiten zur Beantwortung dieser Frage, je nachdem, wie Sie Ihre Punkte verteilen.
quelle