In meiner Wahrscheinlichkeitsklasse werden ständig die Begriffe "Summen von Zufallsvariablen" verwendet. Ich bin jedoch nicht sicher, was das genau bedeutet.
Sprechen wir über die Summe mehrerer Realisierungen aus einer Zufallsvariablen? Wenn ja, ergibt das nicht eine einzige Zahl? Wie führt uns eine Summe von zufälligen Variablenrealisierungen zu einer Distribution oder einer cdf / pdf / -Funktion jeglicher Art? Und wenn es keine zufälligen Variablenrealisierungen sind, was genau wird dann hinzugefügt?
Antworten:
Ein physikalisches, intuitives Modell einer Zufallsvariablen besteht darin, den Namen jedes Mitglieds einer Population auf einen oder mehrere Zettel - "Tickets" - aufzuschreiben und diese Tickets in eine Schachtel zu legen. Der Prozess des gründlichen Mischens des Inhalts der Schachtel, gefolgt vom blinden Herausziehen eines Tickets - genau wie bei einer Lotterie - modelliert die Zufälligkeit. Uneinheitliche Wahrscheinlichkeiten werden durch die Einführung einer variablen Anzahl von Tickets in der Box modelliert: mehr Tickets für die wahrscheinlicheren Mitglieder, weniger für die weniger wahrscheinlichen.
Eine Zufallsvariable ist eine Zahl, die jedem Mitglied der Grundgesamtheit zugeordnet ist. (Aus Konsistenzgründen muss auf jedem Ticket für ein bestimmtes Mitglied dieselbe Nummer geschrieben sein.) Mehrere Zufallsvariablen werden modelliert, indem auf den Tickets Leerzeichen für mehr als eine Nummer reserviert werden. Wir geben in der Regel diese Räume Namen wie und . Die Summe dieser Zufallsvariablen ist die übliche Summe: Reservieren Sie auf jedem Ticket einen neuen Platz für die Summe, lesen Sie die Werte von usw. auf jedem Ticket ab und schreiben Sie ihre Summe in diesen neuen Platz. Dies ist eine konsistente Art, Zahlen auf die Tickets zu schreiben, es ist also eine weitere Zufallsvariable.Y , Z X , Y ,X, Y., Z X, Y.,
Diese Figur zeigt ein Kästchen, das eine Population und drei Zufallsvariablen , und . Es enthält sechs Tickets: Die drei für (blau) ergeben eine Wahrscheinlichkeit von , die zwei für (gelb) ergeben eine Wahrscheinlichkeit von und die eine für (grün) ergeben sie eine Wahrscheinlichkeit von . Um anzuzeigen, was auf den Tickets geschrieben steht, werden diese vor dem Mischen angezeigt.X Y X + Y α 3 / 6 β 2 / 6 γ 1 / 6Ω = { α , β, γ} X Y. X+ Y α 3 / 6 β 2 / 6 γ 1 / 6
Das Schöne an diesem Ansatz ist, dass sich alle paradoxen Teile der Frage als richtig herausstellen:
Die Summe der Zufallsvariablen ist in der Tat eine einzelne, bestimmte Zahl (für jedes Mitglied der Bevölkerung).
es führt aber auch zu einer Verteilung (gegeben durch die Häufigkeiten, mit denen die Summe im Kästchen erscheint), und
Es modelliert immer noch effektiv einen zufälligen Prozess (da die Tickets immer noch blind aus der Schachtel gezogen werden).
Auf diese Weise kann die Summe gleichzeitig einen bestimmten Wert haben (gegeben durch die Additionsregeln, die auf die Nummern auf jedem der Tickets angewendet werden), während die Realisierung - die ein aus der Schachtel gezogenes Ticket sein wird - erst einen Wert hat es wird ausgeführt.
Dieses physikalische Modell des Zeichnens von Tickets aus einer Schachtel wird in der theoretischen Literatur übernommen und mit den Definitionen des Probenraums (der Population), der Sigma-Algebren (mit ihren zugehörigen Wahrscheinlichkeitsmaßen) und Zufallsvariablen als messbare Funktionen, die im Probenraum definiert sind, rigoros gemacht .
Diese Darstellung von Zufallsvariablen wird anhand realistischer Beispiele unter "Was ist mit einer Zufallsvariablen gemeint?" .
quelle
Es gibt kein Geheimnis hinter diesem Satz, es ist so einfach wie Sie denken können: Wenn X und Y zwei Zufallsvariablen sind, ist ihre Summe X + Y und diese Summe ist auch eine Zufallsvariable. Wenn X_1, X_2, X_3, ..., X_n und n Zufallsvariablen sind, ist ihre Summe X_1 + X_2 + X_3 + ... + X_n und diese Summe ist auch eine Zufallsvariable (und eine Realisierung dieser Summe ist eine einzelne Zahl, nämlich eine Summe von n Realisierungen).
Warum redest du so viel über Summen von Zufallsvariablen in der Klasse? Ein Grund ist der (erstaunliche) zentrale Grenzwertsatz: Wenn wir viele unabhängige Zufallsvariablen addieren, können wir die Verteilung dieser Summe (fast) unabhängig von der Verteilung der einzelnen Variablen in der Summe "vorhersagen"! Die Summe tendiert dazu, eine Normalverteilung zu werden, und dies ist der wahrscheinliche Grund, warum wir die Normalverteilung in der realen Welt so oft beobachten.
quelle
rv ist eine Beziehung zwischen dem Auftreten eines Ereignisses und einer reellen Zahl. Sagen wir, wenn es regnet, ist der Wert X 1, wenn es nicht dann 0 ist. Sie können ein weiteres rv Y gleich 10 haben, wenn es kalt ist, und 100, wenn es heiß ist. Also, wenn es regnet und kalt ist, dann ist X = 1, Y = 10 und X + Y = 11.
X + Y-Werte sind 10 (nicht regnerisch); 11 (regnet, kalt), 100 (regnet nicht, heiß) und 110 (regnet, heiß). Wenn Sie unsere Wahrscheinlichkeiten der Ereignisse abschätzen, erhalten Sie die PMF dieses neuen RV X + Y.
quelle
quelle