Sind Unterschiede zwischen gleichmäßig verteilten Zahlen gleichmäßig verteilt?

22

Wir werfen viele Male einen 6-seitigen Würfel.

Wenn Sie die Differenz (den absoluten Wert) zwischen einer Rolle und ihrer vorhergehenden Rolle berechnen, werden die Differenzen voraussichtlich gleichmäßig verteilt?

Zur Veranschaulichung mit 10 Rollen:

roll num  result diff
1           1     0
2           2     1
3           1     1
4           3     2
5           3     0
6           5     2
7           1     4
8           6     5
9           4     2
10          4     0

Würden die diffWerte gleichmäßig verteilt sein?

HeyJude
quelle
13
Zeichnen Sie ein Histogramm, um zumindest einen Eindruck zu bekommen
gunes
2
Schauen Sie sich die Poisson-Distribution an .
links um den
Das sieht nach Hausaufgaben aus ...
Manu H
@Manu H, ich versichere dir, dass die Tage der Hausaufgaben weit hinter mir liegen
HeyJude,

Antworten:

37

Nein, es ist nicht einheitlich

Sie können die ebenso wahrscheinlichen Möglichkeiten für die absoluten Unterschiede zählen36

     second 1   2   3   4   5   6
first                           
1           0   1   2   3   4   5
2           1   0   1   2   3   4
3           2   1   0   1   2   3
4           3   2   1   0   1   2
5           4   3   2   1   0   1
6           5   4   3   2   1   0

Dies ergibt eine Wahrscheinlichkeitsverteilung für die absoluten Differenzen von

0    6/36  1/6
1   10/36  5/18
2    8/36  2/9
3    6/36  1/6
4    4/36  1/9
5    2/36  1/18
Henry
quelle
27
@onurcanbektas Die Tabelle in dieser Antwort widerspricht eindeutig Ihrer Behauptung: Beispielsweise zeigt sie, dass nur einer der möglichen Unterschiede 5 ist, während 6 von ihnen 0 sind. Da alle 36 Möglichkeiten gleich wahrscheinlich sind, ist das nicht einheitlich.
whuber
13
@onurcanbektas Ich lade Sie noch einmal ein, die Tabelle zu betrachten. Ist es nicht offensichtlich, dass nicht mehr als zwei Unterschiede gleich 5 sein können, da es nur zwei absolute Unterschiede von 5 gibt?
whuber
14
@onurcanbektas Für einfache Differenzen (dh mit Vorzeichen, also ganzen Zahlen von -5 bis +5) ist die Verteilung eine symmetrische diskrete Dreiecksverteilung mit dem Modus (wahrscheinlichster Wert) bei 0. Für absolute Differenzen, wie in meiner Antwort gezeigt, ist die Modus ist 1.
Henry
2
Erwähnenswert ist jedoch, dass das vorzeichenbehaftete Differenzmodul 6 gleichmäßig verteilt ist.
Federico Poloni
2
@ FedericoPoloni Ist das nicht trivial offensichtlich? Ich meine, ich habe nie wirklich darüber nachgedacht, bevor ich den Kommentar gelesen habe, aber es ist ziemlich offensichtlich, dass dies einfach wahr sein muss
Cruncher,
21

Wenn man nur die grundlegendsten Axiome über Wahrscheinlichkeiten und reelle Zahlen verwendet, kann man eine viel stärkere Aussage beweisen:

Die Differenz zweier unabhängiger, gleichverteilter nichtkonstanter Zufallswerte XY niemals eine diskrete Gleichverteilung.

(Eine analoge Aussage für stetige Variablen ist bei Uniform PDF über die Differenz von zwei rv bewiesen .)

Die Idee ist, dass die Wahrscheinlichkeit, dass XY ein Extremwert ist, geringer sein muss als die Wahrscheinlichkeit, dass XY Null ist, da es nur einen Weg gibt, um XY maximieren (sagen), während es viele Wege gibt, den Unterschied Null zu machen , weil X und Y die gleiche Verteilung haben und sich daher gleichen können. Hier sind die Details.

Zunächst ist zu beachten, dass die beiden hypothetischen Variablen X und Y mit positiver Wahrscheinlichkeit jeweils nur eine endliche Anzahl n von Werten erreichen können, da es mindestens n deutliche Unterschiede gibt und eine gleichmäßige Verteilung ihnen alle gleiche Wahrscheinlichkeiten zuweist. Wenn n unendlich ist, dann ist dies auch die Anzahl möglicher Differenzen mit positiver, gleicher Wahrscheinlichkeit, von denen die Summe ihrer Chancen unendlich ist, was unmöglich ist.

Als nächstes , da die Anzahl der Unterschiede endlich ist, wird es eine größte unter ihnen sein. Der größte Unterschied kann nur erreicht werden , wenn der kleinste Wert des Subtrahierens Y --let Ruf es m und nehme an, es hat Wahrscheinlichkeit q=Pr(Y=m) --from den größten Wert von --let Anruf ist das , dass ein mit Da und unabhängig voneinander sind, ist die Chance für diesen Unterschied das Produkt dieser Chancen,XMp=Pr(X=M).XY

(*)Pr(XY=Mm)=Pr(X=M)Pr(Y=m)=pq>0.

Schließlich , da und die gleiche Verteilung haben, gibt es viele Möglichkeiten , um ihre Differenzen den Wert erzeugen kann Unter diesen Möglichkeiten sind die Fälle , in denen und Da diese Verteilung nicht konstant ist,XY0.X=Y=mX=Y=M.m unterscheidet sich von M.Dies zeigt, dass diese beiden Fälle disjunkte Ereignisse sind und daher mindestens einen Betrag p2+q2 zur Wahrscheinlichkeit beitragen müssen, dass XY Null ist; das ist,

Pr(XY=0)Pr(X=Y=m)+Pr(X=Y=M)=p2+q2.

Da Quadrate der Zahlen nicht negativ, 0(pq)2, von wo aus man ableiten , () , dass

Pr(XY=Mm)=pqpq+(pq)2=p2+q2pq<p2+q2Pr(XY=0),

zeigt, dass die Verteilung von XY nicht gleichmäßig ist, QED.

Als Antwort auf einen Kommentar bearbeiten

Eine ähnliche Analyse der absoluten Differenzen |XY|stellt fest, dass m = - M ist , weil X und Y die gleiche Verteilung haben . Dies erfordert, dass wir Pr ( X - Y = | M - m | ) = 2 p q studieren . Die gleiche algebraische Technik liefert fast das gleiche Ergebnis, es besteht jedoch die Möglichkeit, dass 2 p q = 2 p q + ( pm=M.Pr(XY=|Mm|)=2pq.2pq=2pq+(pq)2 und2pq+p2+q2=1. Das Gleichungssystem die einzigartige Lösung hatp=q=1/2 auf eine faire Münze entspricht (ein "zweiseitiger Würfel"). Abgesehen von dieser Ausnahme ist das Ergebnis für die absoluten Differenzen das gleiche wie für die Differenzen und aus den gleichen bereits angegebenen Gründen: Nämlich, die absoluten Differenzen zweier iid-Zufallsvariablen können nicht gleichmäßig verteilt werden, wenn es mehr als zwei verschiedene Differenzen gibt mit positiver Wahrscheinlichkeit.

(Ende der Bearbeitung)


Wenden wir dieses Ergebnis auf die Frage an, die nach etwas Komplexerem fragt.

Modelliere jeden unabhängigen Würfelwurf (der ein unfairer Würfel sein könnte) mit einer Zufallsvariablen Xi, i=1,2,,n. Die Unterschiede, die bei diesen n Walzen beobachtet werden, sind die Zahlen ΔXi=Xi+1Xi. Wir fragen uns vielleicht, wie gleichmäßig diese -n1 Zahlen verteilt sind. Das ist wirklich eine Frage zu den statistischen Erwartungen: Wie hoch ist die erwartete Anzahl von ΔXidas sind zum beispiel gleich null? Was ist die erwartete Anzahl von ΔXi gleich 1 ? Usw.

Der problematische Aspekt dieser Frage ist , dass die ΔXi ist nicht unabhängig: beispielsweise ΔX1=X2X1 und ΔX2=X3X2 beinhalten die gleiche Rolle X2.

kknn1kPr(ΔXi=k)ik) genau dann, wenn sie für ein einzelnes ΔXi. Wir haben jedoch gesehen, dass kein ΔXi eine gleichmäßige Verteilung aufweist, selbst wenn der Chip vorgespannt sein könnte. Selbst in diesem schwächeren Sinne der erwarteten Frequenzen sind die Unterschiede der Walzen nicht gleichmäßig.

whuber
quelle
(1/2)
Eine andere Antwort, die eine bestimmte Version davon beweist, ist hier .
Setzen Sie Monica
Danke, @Ben: Ich hatte diesen Thread vergessen. Da es sich um eine bessere Referenz handelt, verweise ich in dieser Antwort direkt darauf.
whuber
12

Auf einer intuitiven Ebene kann ein zufälliges Ereignis nur dann gleichmäßig verteilt werden, wenn alle Ergebnisse gleich wahrscheinlich sind.

Ist das für das fragliche zufällige Ereignis der Fall - absoluter Unterschied zwischen zwei Würfeln?

In diesem Fall reicht es aus, die Extreme zu betrachten - was sind die größten und kleinsten Werte, die dieser Unterschied annehmen könnte?

Offensichtlich ist 0 die kleinste (wir betrachten absolute Unterschiede und die Rollen können gleich sein) und 5 die größte ( 6vs 1).

Wir können zeigen, dass das Ereignis nicht einheitlich ist, indem wir zeigen, dass 0mehr (oder weniger) wahrscheinlich sind als 5.

Auf einen Blick gibt es nur zwei Möglichkeiten, wie 5 auftreten kann - wenn der erste Würfel 6 ist und der zweite 1, oder umgekehrt . Auf wie viele Arten kann 0 auftreten?

MichaelChirico
quelle
1
+1 Ich denke, das bringt die Sache auf den Punkt. Ich habe eine Verallgemeinerung der Frage veröffentlicht, die letztendlich auf der gleichen Beobachtung beruht.
Whuber
5

Wie von Henry dargestellt, sind Unterschiede gleichmäßig verteilter Verteilungen nicht gleichmäßig verteilt.

Um dies mit simulierten Daten zu veranschaulichen, können wir ein sehr einfaches R-Skript verwenden:

barplot(table(sample(x=1:6, size=10000, replace=T)))

Bildbeschreibung hier eingeben

Wir sehen, dass dies tatsächlich eine gleichmäßige Verteilung ergibt. Betrachten wir nun die Verteilung der absoluten Differenzen zweier Zufallsstichproben aus dieser Verteilung.

barplot(table(abs(sample(x=1:6, size=10000, replace=T) - sample(x=1:6, size=10000, replace=T))))

Bildbeschreibung hier eingeben

LuckyPal
quelle
6
Warum hat dies etwas mit der CLT zu tun, die die asymptotische Verteilung der Mittelwerte einer großen Anzahl von iid-Werten betrifft?
whuber
2
nnn>1n=2n=2n=4n
Krubo
3
@Krubo Die ursprüngliche Frage betrifft die Verteilung der Unterschiede zwischen aufeinanderfolgenden Würfeln eines Würfels. Das CLT hat dazu nichts zu sagen. Unabhängig davon, wie oft der Würfel gewürfelt wird, wird die Verteilung dieser Unterschiede der Normalität nicht nahe kommen.
whuber
Neigt diese Verteilung dazu, gleichförmig zu sein, wenn die Anzahl der Düsenflächen gegen unendlich geht? Ich bin mir nicht sicher, wie ich das zeigen soll, aber intuitiv fühlt es sich an, als würde es in diese Richtung gehen, aber ich weiß nicht, ob es irgendwo asymptotisch "blockiert" wird, bevor es genug abgeflacht wird
Cruncher
@Cruncher Sie können die Anzahl der Stanzflächen im R-Code leicht ändern. Je mehr Gesichter vorhanden sind, desto deutlicher wird die Treppenstruktur der Verteilung. '1' ist immer die Spitze dieser Treppe und bei größeren Differenzen nähern sich die Wahrscheinlichkeiten Null. Außerdem ist die Differenz von '0' deutlich seltener als '1'. (Zumindest wenn der kleinste Wert des Würfels '1' ist)
LuckyPal
2

Andere haben die Berechnungen bearbeitet, ich werde Ihnen eine Antwort geben, die mir intuitiver erscheint. Sie wollen die Summe zweier Gleichungen aus rv (Z = X + (-Y)) untersuchen. Die Gesamtverteilung ist das (diskrete) Faltungsprodukt:

P(Z=z)=k=P(X=k)P(Y=zk)

zkz

Aus der Signalverarbeitung wissen wir, wie sich das Faltungsprodukt verhält:

  • Das Faltungsprodukt zweier gleichförmiger Funktionen (zwei Rechtecke) ergibt ein Dreieck. Dies wird durch Wikipedia für kontinuierliche Funktionen veranschaulicht:

Bildbeschreibung hier eingeben

  • zz

  • Allgemeiner wissen wir, dass die einzigen Funktionen, die durch Faltung stabil sind, die der Gaußschen Familie sind. dh nur die Gaußsche Verteilung ist durch Addition (oder allgemeiner durch lineare Kombination) stabil. Dies bedeutet auch, dass Sie beim Kombinieren von Gleichverteilungen keine Gleichverteilung erhalten.

Die Antwort auf die Frage, warum wir diese Ergebnisse erhalten, liegt in der Fourrier-Zerlegung dieser Funktionen. Die Fourrier-Transformation eines Faltungsprodukts ist das einfache Produkt der Fourrier-Transformationen jeder Funktion. Dies gibt direkte Verbindungen zwischen den Fourier-Koeffizienten der Rechteck- und Dreieckfunktionen.

Lcrmorin
quelle
Bitte überprüfen Sie die Gültigkeit Ihrer Ansprüche und die Logik Ihrer Antwort. Die Frage ist nicht, ob die Faltung zweier Gleichverteilungen gleichmäßig ist, sondern ob die Faltung einiger Verteilungen und ihre Umkehrung gleichmäßig sein können. Und es gibt weit mehr Verteilungsfamilien als die Gaußschen, die unter Faltung stabil sind (natürlich Modulo-Standardisierung): siehe en.wikipedia.org/wiki/Stable_distribution
whuber
Sie haben Recht mit stabilen Distributionen. Bei der Frage bin ich mir ziemlich sicher, dass es sich um den Unterschied zweier Zufallswerte mit gleichmäßiger Verteilung handelt (wie im Titel angegeben). Die Frage, ob die Faltung einer Verteilung und ihre Umkehrung gleichmäßig sein können, ist größer als die hier gestellte.
Lcrmorin
1

xy|xy|=kk=0,1,2,3,4,5k

aufeinanderfolgende würfel würfeln unterschied visualisierung

Wie Sie leicht sehen können, ist die Anzahl der Punkte für jede Farbe nicht gleich. Daher sind die Unterschiede nicht gleichmäßig verteilt.

heute
quelle
0

DtXP(Dt=5)=P(Xt=6,Xt1=1)<P((Xt,Xt1){(6,3),(5,2)})<P(Dt=3)

P(Dt=d)d

Hunaphu
quelle