Warum unterscheidet sich die Verteilung von rand () ^ 2 von rand () * rand ()?

14

In Libre Office Calc steht die rand()Funktion zur Verfügung, die aus einer Gleichverteilung einen Zufallswert zwischen 0 und 1 auswählt. Meine Wahrscheinlichkeit ist etwas verrostet. Als ich also folgendes Verhalten sah, war ich verwirrt:

A = 200 × 1 Spalte von rand()^2

B = 200 × 1 Spalte von rand()*rand()

mean(A) = 1/3

mean(B) = 1/4

Warum ist mean(A)! = 1/4?

Jefftopia
quelle
3
Denn die Erwartung des Quadrats einer Zufallsvariablen entspricht nicht dem Quadrat ihrer Erwartung.
Michael M
3
Wenn es rand()wie andere ähnliche Operatoren funktioniert, ist A die gleiche quadratische Zufallszahl und B sind zwei multiplizierte Zufallszahlen.
Peter Flom - Wiedereinsetzung von Monica
Ich verstehe. Wäre sehr hilfreich, wenn ich sehen könnte, wie die Mathematik geschrieben oder mit einer Ressource verknüpft ist, die dies tut.
Jefftopia
4
Wenn Sie die Situation vereinfachen, können Sie den Punkt besser erkennen. Angenommen, Rand()wurde ersetzt durch Int(2*Rand()): Dies nimmt die Werte und 1 mit gleichen Wahrscheinlichkeiten an. Es gibt zwei Möglichkeiten für das Quadrat und vier Möglichkeiten für das Produkt zweier (unabhängiger) Werte: Was passiert, wenn Sie ihre Erwartungen herausarbeiten? 01
whuber

Antworten:

24

Es kann hilfreich sein, an Rechtecke zu denken. Stellen Sie sich vor, Sie haben die Chance, Land kostenlos zu bekommen. Die Größe des Landes wird bestimmt durch (a) eine Verwirklichung der Zufallsvariablen oder (b) zwei Verwirklichungen derselben Zufallsvariablen. Im ersten Fall (a) ist die Fläche ein Quadrat, dessen Seitenlänge dem Abtastwert entspricht. Im zweiten Fall (b) repräsentieren die beiden Abtastwerte die Breite und Länge eines Rechtecks. Welche Alternative wählen Sie?

Lass U eine Realisierung einer positiven Zufallsvariablen.

a) Der Erwartungswert einer Realisierung bestimmt die Fläche des Quadrats, die gleich U 2 ist . Im Durchschnitt beträgt die Größe der Fläche E [ U 2 ].UU2

E[U2]

b) Wenn es zwei unabhängige Realisierungen und U 2 gibt , ist die Fläche U 1U 2 . Im Durchschnitt ist die Größe gleich E [ U 1U 2 ] = E 2 [ U ]U1U2U1U2

E[U1U2]=E2[U]
da beide Realisierungen von derselben Verteilung und unabhängig sind.

Wenn wir die Differenz zwischen der Größe der Flächen a) und b) berechnen, erhalten wir

E[U2]-E2[U]

Veinr[U]0

Dies gilt für den allgemeinen Fall.

U(0,1)

E[U]=12
E2[U]=14
Veinr[U]=112

E[U2]=Veinr[U]+E2[U]

E[U2]=112+14=13

Diese Werte wurden analytisch abgeleitet, stimmen jedoch mit denen überein, die Sie mit dem Zufallszahlengenerator erhalten haben.

Sven Hohenstein
quelle
einbein2+einb+b23
Das ist eine kluge Verwendung von Varianz. Und hier wollte ich gleich die Mathematik ausprobieren.
Affine
Das macht für mich Sinn. Es hängt alles davon ab, dass die Varianz nicht negativ ist. Ich bin auch gespannt, wie John zu seiner Antwort gekommen ist.
Jefftopia
Grundsätzlich folgte nur, was Sven tat, ersetzte sie aber durch die Formeln für eine allgemeinere Gleichverteilung.
John
E[U2]-E[U2]E[U2]-E2[U]
9

Das soll nicht heißen, dass es an Svens hervorragender Antwort mangelt, aber ich wollte eine relativ elementare Sicht auf die Frage präsentieren.

Betrachten Sie das Auftragen der beiden Komponenten jedes Produkts, um festzustellen, dass die gemeinsame Verteilung sehr unterschiedlich ist.

Handlung von u1 vs u2 und u1 vs u1

Beachten Sie, dass das Produkt in der Regel nur groß ist (nahe 1), wenn beide Komponenten groß sind. Dies ist viel einfacher, wenn die beiden Komponenten nicht unabhängig, sondern perfekt korreliert sind.

So zum Beispiel die Wahrscheinlichkeit, dass das Produkt überschreitet1-ϵ (für kleine ϵ) handelt von ϵ/2 für die U2 ('A') Version, aber für die U1×U2 ('B') Version geht es um ϵ2/2.

Ein ziemlicher Unterschied!

Es kann hilfreich sein, Isoproduktkonturen in Diagrammen wie den obigen zu zeichnen - dh Kurven mit xy = Konstante für Werte wie 0,5, 0,6, 0,7, 0,8, 0,9. Wenn Sie zu immer größeren Werten wechseln, nimmt der Anteil der Punkte über und rechts von der Kontur für den unabhängigen Fall viel schneller ab.

Glen_b - Setzen Sie Monica wieder ein
quelle