Wenn und zwei unabhängige zufällige Einheitsvektoren in (gleichmäßig auf einer Einheitskugel verteilt), wie lautet die Verteilung ihres Skalarprodukts (Skalarprodukt) ?
Ich vermute, als wächst, wird die Verteilung schnell normal (?), Wobei der Mittelwert Null und die Varianz in höheren Dimensionen abnehmen. aber gibt es eine explizite Formel für \ Sigma ^ 2 (D) ? σ 2 (D)
Aktualisieren
Ich habe einige schnelle Simulationen durchgeführt. Wenn man 10000 Paare zufälliger Einheitsvektoren für , ist leicht zu erkennen, dass die Verteilung ihrer Punktprodukte perfekt Gauß ist (tatsächlich ist sie bereits für D = 100 ziemlich Gauß ), siehe die Nebenkurve auf der linken Seite. Zweitens habe ich für jedes Bereich von 1 bis 10000 (mit zunehmenden Schritten) 1000 Paare generiert und die Varianz berechnet. Log-Log-Plot wird rechts gezeigt, und es ist klar, dass die Formel sehr gut durch 1 / D angenähert ist . Beachten Sie, dass diese Formel für und sogar genaue Ergebnisse liefert (aber ich bin nicht sicher, was später passiert).
quelle
Antworten:
Da ( wie allgemein bekannt ) eine gleichmäßige Verteilung auf der Einheitskugel durch Normalisieren einer Variantennormalverteilung erhalten wird und das Punktprodukt der normalisierten Vektoren ihr Korrelationskoeffizient ist, sind die Antworten auf die drei Fragen sind: DSD−1 D t
( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u=(t+1)/2 hat eine Beta -Verteilung.((D−1)/2,(D−1)/2)
Die Varianz von ist (wie in der Frage spekuliert).1 / Dt 1/D
Die standardisierte Verteilung von nähert sich der Normalität mit einer Rate vonO ( 1t O(1D).
Methode
Die genaue Verteilung des Punktprodukts von Einheitsvektoren ist geometrisch leicht zu erhalten, da dies die Komponente des zweiten Vektors in Richtung des ersten ist. Da der zweite Vektor unabhängig vom ersten ist und gleichmäßig auf der Einheitskugel verteilt ist, ist seine Komponente in der ersten Richtung genauso verteilt wie jede Koordinate der Kugel. (Beachten Sie, dass die Verteilung des ersten Vektors keine Rolle spielt.)
Die Dichte finden
Wenn diese Koordinate die letzte ist, ist die Dichte bei daher proportional zur Oberfläche, die in einer Höhe zwischen und auf der Einheitskugel liegt. Dieser Anteil tritt innerhalb eines Riemens mit der Höhe und dem Radius der im Wesentlichen ein Kegelstumpf ist , der aus einem mit dem Radius der Höhe und Steigung . Woher ist die Wahrscheinlichkeit proportional zut t + d t d t √t∈[−1,1] t t+dt dt S D - 2 √1−t2−−−−−√, SD−2 dt1/ √1−t2−−−−−√, dt 1/1−t2−−−−−√
Wenn ist, ist . Wenn man das in das Vorhergehende einfügt, ergibt sich für das Wahrscheinlichkeitselement eine normalisierende Konstante:T = 2 u - 1u=(t+1)/2∈[0,1] t=2u−1
Es ist unmittelbar, dass eine Beta -Verteilung hat, weil (per Definition) auch seine Dichte proportional zu ist( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u=(t+1)/2 ((D−1)/2,(D−1)/2)
Festlegen des Begrenzungsverhaltens
Daraus ergeben sich mit elementaren Techniken leicht Informationen über das Begrenzungsverhalten: kann integriert werden, um die Proportionalitätskonstante ; kann integriert werden (z. B. unter Verwendung von Eigenschaften von Beta-Funktionen), um Momente zu erhalten, die zeigen, dass die Varianz und auf schrumpft (ausgehend von Chebyshevs Theorem wird die Wahrscheinlichkeit in der Nähe von konzentriert) ); und die Grenzverteilung wird dann gefunden, indem Werte der Dichte der standardisierten Verteilung, proportional zu für kleine Werte von berücksichtigt werdenΓ ( nfD tkfD(t)1/D0t=0fD(t/√Γ(n2)π√Γ(D−12) tkfD(t) 1/D 0 t=0 tfD(t/D−−√), t :
wobei die 's (log) Integrationskonstanten darstellen. Offensichtlich ist die Rate, mit der sich dies der Normalität nähert (für die die logarithmische Dichte gleich ),- 1C O(1−12t2 O(1D).
Dieses Diagramm zeigt die Dichten des Punktprodukts für , wie auf Einheitsvarianz standardisiert, und ihre Grenzdichte. Die Werte bei erhöhen sich mit (von blau über rot, gold und dann grün für die normale Standarddichte). Die Dichte für wäre bei dieser Auflösung nicht von der normalen Dichte zu unterscheiden.0 D D = 1000D=4,6,10 0 D D=1000
quelle
Lassen Sie uns anhand der Standardergebnisse die Verteilung und dann die Varianz bestimmen. Betrachten Sie das Vektorprodukt und schreiben Sie es in seine Kosinusform, dh beachten Sie, dass wir wobei der Winkel zwischen und . Im letzten Schritt habe ich das für alle Ereignisse undBetrachte nun den Term . Es ist klar, dass es keine Rolle spielt, was ist, da Bezug auf die Kugeloberfläche gleichmäßig gewählt wirdθ x y A B E P ( A ∣ B ) : = E [ E [ χ
Um ein explizites Ergebnis der Varianz zu erhalten, verwenden Sie die Tatsache, dass das Skalarprodukt Null als Unabhängigkeit bedeutet und, wie oben gezeigt, wie die erste Koordinate von . Nach diesen Ergebnissen entspricht das Finden von dem Finden von . Beachten Sie nun, dass pro Konstruktion und somit wobei die letzte Gleichheit daraus folgt, dass die Koordinaten von identisch verteilt sind. Beim Zusammenfügen haben wir festgestellt, dassVar ( x ' y ) E x 2 1 x ' x = 1 1 = E x ' x = E n ≤ i = 1 x 2 i = n ≤ i = 1 E x 2 i = n E x 2 1 , x Var ( x ' y ) = E x 2 1x Var(x′y) Ex21 x′x=1
quelle
Um den ersten Teil Ihrer Frage zu beantworten, bezeichnen Sie . Definiere Das Produkt der -Elemente von und die hier als werden, werden gemäß der gemeinsamen Verteilung von und . dann seit ,Z=⟨X,Y⟩=∑XiYi
Für den zweiten Teil denke ich, dass Sie, wenn Sie etwas Interessantes über das asymptotische Verhalten von sagen möchten, mindestens die Unabhängigkeit von und annehmen und dann eine CLT anwenden müssen.σ X Y
Wenn Sie beispielsweise annehmen , dass die mit und Sie dies Sagen Sie, dass und .{Z1,…,ZD} E[Zi]=μ V[Zi]=σ2 σ2(D)=σ2D limD→∞σ2(D)=0
quelle