Kann jemand das Konzept einer „Summe von Zufallsvariablen“ klarstellen?

21

In meiner Wahrscheinlichkeitsklasse werden ständig die Begriffe "Summen von Zufallsvariablen" verwendet. Ich bin jedoch nicht sicher, was das genau bedeutet.

Sprechen wir über die Summe mehrerer Realisierungen aus einer Zufallsvariablen? Wenn ja, ergibt das nicht eine einzige Zahl? Wie führt uns eine Summe von zufälligen Variablenrealisierungen zu einer Distribution oder einer cdf / pdf / -Funktion jeglicher Art? Und wenn es keine zufälligen Variablenrealisierungen sind, was genau wird dann hinzugefügt?

Gosset
quelle
1
Mit "Realisierungen einer Zufallsvariablen" meine ich die tatsächlich beobachteten Werte. Was in der Summe der Zufallsvariablen summiert wird, sind die Zufallsvariablen, bevor sie beobachtet werden. Stellen Sie sich vor, Sie berechnen das Gewicht der nächsten 5 Personen, die in den Aufzug steigen. Sie kennen ihre Gewichte (noch) nicht und so sind sie jeweils eine Zufallsvariable. Aber Sie möchten wahrscheinlich etwas über die Verteilung der Summe ihrer Gewichte wissen.
PeterR
@PeterR Das verstehe ich nicht. Wie macht es überhaupt Sinn, über das Hinzufügen von etwas zu sprechen, das noch keinen Wert hat? Ist es eine metaphorische Art der Summierung?
Gosset
1
Ich denke, Ihr Problem ist, dass Sie nicht verstehen, was eine Zufallsvariable ist. Wenn Sie dieses Konzept erhalten, wird die Summe auch leicht kommen.
Aksakal
@Aksakal Ist die Tatsache, dass ich diese Frage gestellt habe, kein Beweis dafür? Vielleicht könnten Sie, wenn Sie es wissen, das Konzept klären?
Gosset
Es wurden großartige Antworten gegeben. Ein weiteres gutes Beispiel ist die Summe von zwei Würfeln, . Das Ergebnis ist eindeutig zufällig (Sie wissen nicht im Voraus, wie hoch die Summe der beiden Würfel sein wird). Wir wissen, dass und unabhängig. Es zeigt sich, dass eine Dreiecksverteilung hat. X , Y U n i f ( 1 , 6 ) X + YX+Y.X,Y.Unichf(1,6)X+Y.
bdeonovic

Antworten:

39

Ein physikalisches, intuitives Modell einer Zufallsvariablen besteht darin, den Namen jedes Mitglieds einer Population auf einen oder mehrere Zettel - "Tickets" - aufzuschreiben und diese Tickets in eine Schachtel zu legen. Der Prozess des gründlichen Mischens des Inhalts der Schachtel, gefolgt vom blinden Herausziehen eines Tickets - genau wie bei einer Lotterie - modelliert die Zufälligkeit. Uneinheitliche Wahrscheinlichkeiten werden durch die Einführung einer variablen Anzahl von Tickets in der Box modelliert: mehr Tickets für die wahrscheinlicheren Mitglieder, weniger für die weniger wahrscheinlichen.

Eine Zufallsvariable ist eine Zahl, die jedem Mitglied der Grundgesamtheit zugeordnet ist. (Aus Konsistenzgründen muss auf jedem Ticket für ein bestimmtes Mitglied dieselbe Nummer geschrieben sein.) Mehrere Zufallsvariablen werden modelliert, indem auf den Tickets Leerzeichen für mehr als eine Nummer reserviert werden. Wir geben in der Regel diese Räume Namen wie und . Die Summe dieser Zufallsvariablen ist die übliche Summe: Reservieren Sie auf jedem Ticket einen neuen Platz für die Summe, lesen Sie die Werte von usw. auf jedem Ticket ab und schreiben Sie ihre Summe in diesen neuen Platz. Dies ist eine konsistente Art, Zahlen auf die Tickets zu schreiben, es ist also eine weitere Zufallsvariable.Y , Z X , Y ,X, Y.,ZX, Y.,

Zahl

Diese Figur zeigt ein Kästchen, das eine Population und drei Zufallsvariablen , und . Es enthält sechs Tickets: Die drei für (blau) ergeben eine Wahrscheinlichkeit von , die zwei für (gelb) ergeben eine Wahrscheinlichkeit von und die eine für (grün) ergeben sie eine Wahrscheinlichkeit von . Um anzuzeigen, was auf den Tickets geschrieben steht, werden diese vor dem Mischen angezeigt.X Y X + Y α 3 / 6 β 2 / 6 γ 1 / 6Ω={α,β,γ}XY.X+Y.α3/6β2/6γ1/6

Das Schöne an diesem Ansatz ist, dass sich alle paradoxen Teile der Frage als richtig herausstellen:

  • Die Summe der Zufallsvariablen ist in der Tat eine einzelne, bestimmte Zahl (für jedes Mitglied der Bevölkerung).

  • es führt aber auch zu einer Verteilung (gegeben durch die Häufigkeiten, mit denen die Summe im Kästchen erscheint), und

  • Es modelliert immer noch effektiv einen zufälligen Prozess (da die Tickets immer noch blind aus der Schachtel gezogen werden).

Auf diese Weise kann die Summe gleichzeitig einen bestimmten Wert haben (gegeben durch die Additionsregeln, die auf die Nummern auf jedem der Tickets angewendet werden), während die Realisierung - die ein aus der Schachtel gezogenes Ticket sein wird - erst einen Wert hat es wird ausgeführt.

Dieses physikalische Modell des Zeichnens von Tickets aus einer Schachtel wird in der theoretischen Literatur übernommen und mit den Definitionen des Probenraums (der Population), der Sigma-Algebren (mit ihren zugehörigen Wahrscheinlichkeitsmaßen) und Zufallsvariablen als messbare Funktionen, die im Probenraum definiert sind, rigoros gemacht .

Diese Darstellung von Zufallsvariablen wird anhand realistischer Beispiele unter "Was ist mit einer Zufallsvariablen gemeint?" .

whuber
quelle
3
+1 vorbildlicher Beitrag. Ich hoffe, Sie haben nichts gegen die unverschämte Frage, aber wie wurde die Illustration gemacht?
Glen_b -Reinstate Monica
4
@ Glen_b PowerPoint :-). Das Bild einer Box stammt von mymiddlec.files.wordpress.com/2013/09/empty-box.jpg . Die Tickets sind PowerPoint-Grafiken. (Es ist nichts Unverschämtes an solchen Fragen!) Ich habe den ganzen Haufen gruppiert, in Paint eingefügt und damit als PNG-Datei gespeichert.
whuber
Mir fehlt etwas, aber anscheinend schreiben Sie nur mehrere numerische Bezeichnungen für jedes Bevölkerungsmitglied. Alle Alphas haben X = 1, Y = 2 und somit X + Y = 3. X, Y und X + Y haben genau die gleiche Verteilung, verschoben um einen Wert hier und einen Wert dort, wegen unterschiedlicher Lebels
MiloMinderbinder
1
@whuber - sollte Frequenzen geschrieben haben. Nicht gut mit mathematischen Jargons vertraut, um "zugrunde liegendes Wahrscheinlichkeitsmaß" zu sagen. Wie dem auch sei, du kriegst meinen Drift. Ich beginne zu sehen, wie ich mit Zahlen auf Tickets herumspielen kann, um ihm die gewünschte Wahrscheinlichkeitsverteilung zu geben. Auf der oberflächlichen Ebene schien dieser Ansatz nur ein Wortspiel mit verschiedenen "Labels" zu sein und war daher nicht klar zu erkennen. Das wäre ungefähr das 50. Mal, dass Sie mir auf dieser Seite geholfen haben. danke
MiloMinderbinder
1
@Milo Gern geschehen. Ich sehe jetzt, dass Sie auf das Beispiel in dieser Antwort reagiert haben und nicht auf das Beispiel, das ich in den vorhergehenden Kommentaren gegeben habe. Das Beispiel der Antwort hat tatsächlich drei verschiedene Tickets mit relativen Frequenzen 1: 2: 3, und das ist alles, was "Wahrscheinlichkeitsmaß" in diesem Fall bedeutet. Dies ist jedoch nicht nur Jargon: Die zugrunde liegenden Konzepte sind dringend erforderlich. Siehe unter anderem stats.stackexchange.com/questions/199280 für ein paar netten Konten.
whuber
4

Es gibt kein Geheimnis hinter diesem Satz, es ist so einfach wie Sie denken können: Wenn X und Y zwei Zufallsvariablen sind, ist ihre Summe X + Y und diese Summe ist auch eine Zufallsvariable. Wenn X_1, X_2, X_3, ..., X_n und n Zufallsvariablen sind, ist ihre Summe X_1 + X_2 + X_3 + ... + X_n und diese Summe ist auch eine Zufallsvariable (und eine Realisierung dieser Summe ist eine einzelne Zahl, nämlich eine Summe von n Realisierungen).

Warum redest du so viel über Summen von Zufallsvariablen in der Klasse? Ein Grund ist der (erstaunliche) zentrale Grenzwertsatz: Wenn wir viele unabhängige Zufallsvariablen addieren, können wir die Verteilung dieser Summe (fast) unabhängig von der Verteilung der einzelnen Variablen in der Summe "vorhersagen"! Die Summe tendiert dazu, eine Normalverteilung zu werden, und dies ist der wahrscheinliche Grund, warum wir die Normalverteilung in der realen Welt so oft beobachten.

jolvi
quelle
3

rv ist eine Beziehung zwischen dem Auftreten eines Ereignisses und einer reellen Zahl. Sagen wir, wenn es regnet, ist der Wert X 1, wenn es nicht dann 0 ist. Sie können ein weiteres rv Y gleich 10 haben, wenn es kalt ist, und 100, wenn es heiß ist. Also, wenn es regnet und kalt ist, dann ist X = 1, Y = 10 und X + Y = 11.

X + Y-Werte sind 10 (nicht regnerisch); 11 (regnet, kalt), 100 (regnet nicht, heiß) und 110 (regnet, heiß). Wenn Sie unsere Wahrscheinlichkeiten der Ereignisse abschätzen, erhalten Sie die PMF dieses neuen RV X + Y.

Aksakal
quelle
1

X,Y.X+Y.Ω1×Ω2X,Y.Ω={Heeind,Teinichl}X(Heeind)=Y.(Heeind)=1,X(Teinichl)=Y.(Teinichl)=0(X+Y.)X,Y.σ-X,Y.

Daniel Li
quelle