Was bedeuten sie, wenn sie "Zufallsvariable" sagen?
69
Was bedeuten sie, wenn sie "Zufallsvariable" sagen?
Eine Zufallsvariable ist eine Variable, deren Wert von unbekannten Ereignissen abhängt. Wir können die unbekannten Ereignisse als "Zustand" zusammenfassen, und dann ist die Zufallsvariable eine Funktion des Zustands.
Beispiel:
Angenommen, wir haben drei Würfelwürfe ( , , ). Dann ist der Zustand . D 2 D 3 S = ( D 1 , D 2 , D 3 )
a sample
, den ich gebeten habe, von den Ergebnissen zu unterscheiden . Warum müssen Sie eine Funktion einführen und sie Zufallsvariable nennen, obwohl sie absolut deterministisch und überhaupt nicht variabel ist? Warum können Sie das Ergebnis nicht sofort abtasten?Einführung
Beim Nachdenken über einen jüngsten Kommentar stelle ich fest, dass alle Antworten bisher unter der Verwendung von undefinierten Begriffen wie "Variable" und vagen Begriffen wie "Unbekannt" leiden oder sich auf technische mathematische Konzepte wie "Funktion" und "Wahrscheinlichkeitsraum" beziehen. Was sollen wir der nicht-mathematischen Person sagen, die eine einfache, intuitive und dennoch genaue Definition von "Zufallsvariablen" haben möchte? Nach einigen Vorbemerkungen, die ein einfaches Modell zufälliger Phänomene beschreiben, stelle ich eine Definition bereit, die kurz genug ist, um auf eine Zeile zu passen. Da dies den Cognoscenti möglicherweise nicht vollständig befriedigt , wird im Anschluss erklärt, wie dies auf die übliche technische Definition ausgeweitet werden kann.
Tickets in einer Box
Eine Möglichkeit, sich der Idee hinter einer Zufallsvariablen zu nähern , besteht darin, sich an das Ticket-in-a-Box-Modell der Zufälligkeit zu wenden . Dieses Modell ersetzt ein Experiment oder eine Beobachtung durch eine Schachtel voller Tickets. Auf jedem Ticket steht ein mögliches Ergebnis des Experiments. (Ein Ergebnis kann so einfach wie "Kopf" oder "Zahl" sein. In der Praxis ist es jedoch komplexer, z. B. die Geschichte der Aktienkurse, die vollständige Aufzeichnung eines langen Experiments oder die Abfolge aller Wörter in einem Dokument .) Alle möglichen Ergebnisse erscheinen mindestens einmal unter den Tickets; Einige Ergebnisse können auf vielen Tickets angezeigt werden.
Anstatt das Experiment tatsächlich durchzuführen, stellen wir uns vor, alle Tickets gründlich - aber blind - zu mischen und nur eine auszuwählen. Wenn wir zeigen können, dass sich das reale Experiment so verhalten sollte, als würde es auf diese Weise durchgeführt, haben wir ein potenziell kompliziertes (und teures und langwieriges) Experiment in der realen Welt auf ein einfaches, intuitives Gedankenexperiment (oder "statistisches Modell" ) reduziert "). Die Klarheit und Einfachheit dieses Modells ermöglicht die Analyse des Experiments.
Ein Beispiel
Standardbeispiele betreffen die Ergebnisse des Werfens von Münzen und Würfeln und des Ziehens von Spielkarten. Diese sind aufgrund ihrer Trivialität etwas ablenkend. Nehmen wir an, wir sind besorgt über das Ergebnis der US-Präsidentschaftswahlen im Jahr 2016. Als (winzige) Vereinfachung gehe ich davon aus, dass eine der beiden großen Parteien - Republikaner (R) oder Demokratisch (D) - wird gewinnen. Da das Ergebnis (mit den derzeit verfügbaren Informationen) ungewiss ist, stellen wir uns vor, dass Tickets in eine Schachtel gelegt werden: einige mit "R" und andere mit "D". Unser Modell des Ergebnisses ist es, genau ein Ticket aus dieser Box zu ziehen.
Es fehlt etwas: Wir haben noch nicht festgelegt, wie viele Tickets es für jedes Ergebnis geben wird. Dies herauszufinden ist in der Tat das Hauptproblem der Statistik: Basierend auf Beobachtungen (und der Theorie), was kann über die relativen Anteile der einzelnen Ergebnisse in der Box gesagt werden?
(Ich hoffe, es ist klar, dass die Proportionen jeder Art von Ticket in der Box ihre Eigenschaften bestimmen und nicht die tatsächlichen Zahlen jeder Art von Ticket. Die Proportionen sind - wie üblich - definiert als die Anzahl jeder Art von Ticket geteilt durch Die Gesamtzahl der Tickets: Beispielsweise verhält sich eine Box mit einem "D" -Ticket und einem "R" -Ticket genau wie eine Box mit einer Million "D" -Tickets und einer Million "R" -Tickets 50% aller Tickets und somit jeweils eine 50% ige Chance, gezogen zu werden, wenn die Tickets gründlich gemischt werden.)
Das Modell quantitativ machen
Aber lassen Sie uns diese Frage hier nicht weiter verfolgen, da wir nahe an unserem Ziel sind, eine Zufallsvariable zu definieren. Das Problem mit dem Modell ist bisher, dass es nicht quantifizierbar ist, während wir damit quantitative Fragen beantworten möchten. Und damit meine ich auch keine trivialen, sondern reale, praktische Fragen wie: "Wenn mein Unternehmen eine Milliarde Euro in die Entwicklung fossiler Offshore-Brennstoffe in den USA investiert hat, um wie viel wird sich der Wert dieser Investition infolge der Wahlen 2016 ändern?" ? " In diesem Fall ist das Modell so einfach, dass wir nicht viel tun können, um eine realistische Antwort auf diese Frage zu erhalten. Wir könnten jedoch so weit gehen, unsere Wirtschaftspersonal zu konsultieren und ihre Meinung zu den beiden möglichen Ergebnissen einzuholen:
Wenn die Demokraten gewinnen, wie stark wird sich die Investition ändern? (Angenommen, die Antwort lautet Dollar.)d
Wenn die Republikaner gewinnen, wie stark wird sich das ändern? (Angenommen, die Antwort lautet Dollar.)r
Die Antworten sind Zahlen. Um sie in dem Modell zu verwenden, werde ich meine Mitarbeiter bitten, alle Tickets in der Box durchzugehen und auf jedem "D" -Ticket " Dollars" und auf jedem "R" -Ticket " Dollars" zu schreiben . Jetzt können wir die Unsicherheit der Investition klar und quantitativ modellieren: Ihre Wertänderung nach der Wahl entspricht dem Erhalt des Geldbetrags, der auf ein einzelnes Ticket geschrieben wurde, das zufällig aus dieser Box gezogen wurde.rd r
Dieses Modell hilft uns, zusätzliche Fragen zur Investition zu beantworten. Zum Beispiel, wie unsicher sollten wir über die Investition des Wert sein ? Obwohl es (einfache) mathematische Formeln für diese Unsicherheit gibt, können wir ihre Antworten einigermaßen genau reproduzieren, indem wir unser Modell wiederholt - vielleicht tausendmal - verwenden, um zu sehen, welche Arten von Ergebnissen tatsächlich auftreten, und um ihre Streuung zu messen. Ein Ticket-in-a-Box-Modell gibt uns die Möglichkeit, unsichere Ergebnisse quantitativ zu beurteilen.
Zufällige Variablen
Um quantitative Antworten zu unsicheren oder variablen Phänomenen zu erhalten, können wir ein Ticket-in-a-Box-Modell anwenden und Zahlen auf die Tickets schreiben. Dieser Prozess des Schreibens von Zahlen muss nur einer einzigen Regel folgen: Er muss konsistent sein. In diesem Beispiel muss auf jedem demokratischen Ticket " Dollars" stehen - ausnahmslos - und auf jedem republikanischen Ticket müssen " Dollars" stehen.rd r
Eine Zufallsvariable ist eine konsistente Methode, um Zahlen auf Tickets in eine Box zu schreiben.
(Die mathematische Notation dafür ist, dem Umnummerierungsprozess einen Namen zu geben , typischerweise mit einem lateinischen Großbuchstaben wie oder Die auf den Tickets geschriebenen Identifikationsinformationen werden oft mit kleinen Buchstaben benannt, typischerweise (griechisches Omega in Kleinbuchstaben) "). Der Wert, der mit der Zufallsvariablen dem Ticket ist, wird mit . Im Beispiel könnte man dann sagen, dass" eine Zufallsvariable ist, die die Änderung des Werts der Investition darstellt Msgstr "" "Es würde vollständig spezifiziert, indem undY ω X ω X ( ω ) X X ( D ) = D X ( R ) = R X X XX Y ω X ω X(ω) X X(D)=d X(R)=r . In komplizierteren Fällen werden die Werte von durch kompliziertere Beschreibungen und häufig durch Formeln angegeben. Beispielsweise können die Tickets einen Jahresschlusskurs einer Aktie darstellen, und die Zufallsvariable kann der Wert eines Derivats dieser Aktie zu einem bestimmten Zeitpunkt sein, z. B. eine Verkaufsoption. Der Optionsvertrag beschreibt, wie berechnet wird. Optionshändler verwenden genau diese Art von Modell, um ihre Produkte zu bewerten.)X X X
Danach: über Messbarkeit
Wenn die Definition einer Zufallsvariablen mit der Einschränkung "messbar" einhergeht, hat der Definierer eine Verallgemeinerung des Ticket-in-a-Box-Modells auf Situationen mit unendlich vielen möglichen Ergebnissen im Sinn. (Technisch gesehen wird es nur bei unzähligen Endpunkten benötigt oder wenn irrationale Wahrscheinlichkeiten involviert sind, und selbst im letzteren Fall kann es vermieden werden.) Bei unendlich vielen Endpunkten ist es schwierig zu sagen, wie hoch der Anteil an der Gesamtsumme sein würde. Wenn es unendlich viele "D" -Karten und unendlich viele "R" -Karten gibt, wie sind ihre relativen Anteile? Wir können es nicht mit einer bloßen Teilung einer Unendlichkeit durch eine andere herausfinden!
In diesen Fällen müssen die Proportionen auf andere Weise angegeben werden. Eine "messbare" Menge von Tickets ist jede Sammlung von Tickets in der Box, für die ihr Anteil definiert werden kann. Wenn dies geschehen ist, wird die Zahl, die wir als "Proportion" betrachtet haben, als "Wahrscheinlichkeit" bezeichnet. (Nicht mit jeder Sammlung von Tickets muss eine Wahrscheinlichkeit verbunden sein.)
quelle
Informell ist eine Zufallsvariable eine Möglichkeit, jedem möglichen Ergebnis einen numerischen Code zuzuweisen. *
Beispiel 1
Beispiel 2
In der Brücke zählt ein Ass 4 hohe Kartenpunkte, ein König 3, eine Dame 2 und ein Bube 1. Jede andere Karte zählt 0 Punkte.
* Formal ist eine Zufallsvariable eine Funktion, die jedes Ergebnis (im Stichprobenraum) einer reellen Zahl zuordnet.
quelle
Im Gegensatz zu einer regulären Variablen darf eine Zufallsvariable nicht durch einen einzigen, unveränderlichen Wert ersetzt werden. Vielmehr können statistische Eigenschaften wie die Verteilung der Zufallsvariablen angegeben werden. Die Verteilung ist eine Funktion, die die Wahrscheinlichkeit angibt, mit der die Variable einen bestimmten Wert annimmt oder in einen Bereich fällt, der bestimmte Parameter wie den Mittelwert oder die Standardabweichung enthält.
Zufallsvariablen können als diskret klassifiziert werden, wenn die Verteilung Werte aus einer zählbaren Menge beschreibt, z. B. die ganzen Zahlen. Die andere Klassifizierung für eine Zufallsvariable ist stetig und wird verwendet, wenn die Verteilung Werte aus einer unzähligen Menge wie die reellen Zahlen abdeckt.
quelle
Mir wurde diese Geschichte erzählt:
Ebenso ist eine Zufallsvariable weder zufällig noch eine Variable. Es ist nur eine Funktion. (Die Geschichte wurde hier erzählt: Quelle ).
Dies ist zumindest eine schnelle Art zu erklären, die den Menschen helfen könnte, sich zu erinnern!
quelle
Aus Wikipedia :
Von cnx.org :
quelle
Eine Zufallsvariable, normalerweise mit X bezeichnet, ist eine Variable, bei der das Ergebnis ungewiss ist. Die Beobachtung eines bestimmten Ergebnisses dieser Variablen wird als Realisierung bezeichnet. Genauer gesagt ist es eine Funktion, die einen Wahrscheinlichkeitsraum in einen messbaren Raum abbildet, der üblicherweise als Zustandsraum bezeichnet wird. Zufallsvariablen sind diskret (können mehrere unterschiedliche Werte annehmen) oder kontinuierlich (können unendlich viele Werte annehmen).
Betrachten Sie die Zufallsvariable X, die die Summe ist, die beim Würfeln von zwei Würfeln erhalten wird. Es kann jeder der Werte 2-12 annehmen (mit gleicher Wahrscheinlichkeit bei fairen Würfeln) und das Ergebnis ist ungewiss, bis die Würfel gewürfelt werden.
quelle
Während meines Studiums an einer anderen Universität als der Mathematik wurde uns gesagt, dass eine Zufallsvariable eine Karte von Werten ist, die eine Variable für die Wahrscheinlichkeiten annehmen kann. Dies erlaubte es, die Wahrscheinlichkeitsverteilungen zu zeichnen
Kürzlich habe ich gemerkt, wie anders sich das von den Mathematikern unterscheidet. Es zeigt sich, dass sie mit der Zufallsvariablen eine einfache Funktion X: Ω → R meinen, die ein Element des Probenraums Ω (auch als Ergebnis, Ticket oder Einzelperson bezeichnet , wie oben erläutert) in eine reelle Zahl R im Bereich übersetzt ( -∞, ∞). Das heißt, es wurde treffend oben angemerkt, dass es nicht zufällig und überhaupt nicht variabel ist. Die Zufälligkeit wird normalerweise mit dem Wahrscheinlichkeitsmaß P als Teil des Maßraums (Ω, P) angegeben. P bildet Abtastwerte auf R ab, ähnlich wie eine Zufallsvariable, aber dieser Zeitbereich ist auf [0,1] begrenzt, und wir können sagen, dass eine Zufallsvariable (Ω, P) in (R, P) übersetzt, und somit ist eine Zufallsvariable mit einer Wahrscheinlichkeit ausgestattet messen Sie P: R -> [0,1], damit Sie für jedes x in R die Wahrscheinlichkeit seines Auftretens angeben können.
Ich weiß nicht, warum Sie diese Art von Zufallsvariablen benötigen und warum Sie die Elemente von R überhaupt nicht abtasten können, aber es scheint, dass wir durch die Übersetzung von Samples in numerische Werte die Samples ordnen, die Verteilung zeichnen und die Erwartung berechnen können. Ich habe die Idee, ein Tutorial zur Maßtheorie (Measure Theory for Dummies) zu lesen. Vielleicht haben Mathematiker bessere Anwendungen von Zufallsvariablen im Sinn, aber ich kann sie in meiner überflüssigen Studie nicht finden. Aus demselben Text geht hervor, dass Sie Samples nicht immer in Zahlen konvertieren müssen, insbesondere um die Entropie für das Alphabet zu berechnenΩ
Das Integral benötigt keine reellen Werte der Zufallsvariablen.
quelle