Was ist mit einer Zufallsvariablen gemeint?

Antworten:

35

Eine Zufallsvariable ist eine Variable, deren Wert von unbekannten Ereignissen abhängt. Wir können die unbekannten Ereignisse als "Zustand" zusammenfassen, und dann ist die Zufallsvariable eine Funktion des Zustands.

Beispiel:

Angenommen, wir haben drei Würfelwürfe ( , , ). Dann ist der Zustand . D 2 D 3 S = ( D 1 , D 2 , D 3 )D1D2D3S=(D1,D2,D3)

  1. Eine Zufallsvariable ist die Zahl 5s. Das ist:X

X=(D1=5?)+(D2=5?)+(D3=5?)
  1. Eine weitere Zufallsvariable ist die Summe der Würfelwürfe. Das ist:Y

Y=D1+D2+D3
Paul
quelle
Danke für die klare und prägnante Antwort. Es wirft die Frage auf, ob der unbekannte Zustand vom Ausgang getrennt werden soll (ich denke, so werden Domäne und Bereich der "Zufallsvariablen" in der Wahrscheinlichkeitstheorie genannt). Es scheint, dass der unbekannte Zustand genannt wird a sample, den ich gebeten habe, von den Ergebnissen zu unterscheiden . Warum müssen Sie eine Funktion einführen und sie Zufallsvariable nennen, obwohl sie absolut deterministisch und überhaupt nicht variabel ist? Warum können Sie das Ergebnis nicht sofort abtasten?
Val
2
Was passiert mit der Zufallsvariablen, wenn die "Ereignisse" "bekannt" werden? Nach dieser Antwort kann es nicht mehr existieren! Das Vertrauen dieser Antwort auf solche nebulösen Ideen wie "bekannt" - was rein subjektiv ist - macht sie als Definition oder Erklärung von Zufallsvariablen weniger als zufriedenstellend.
Whuber
1
@whuber Englisch und andere menschliche Sprache ist notwendigerweise ungenau. Es scheint, dass Sie tatsächlich das Wort "abhängig" auswählen, nicht "bekannt". "ist eine Funktion von" ist genauer, aber dann ist "unbekannte Ereignisse" vage, und so definieren die Mathematiker einen "Wahrscheinlichkeitsraum", eine "Sigma-Algebra", "messbare Funktionen" usw. Wenn Sie eine strengere Behandlung benötigen, empfiehlt sich Wikipedia hat es: en.wikipedia.org/wiki/Random_variable
Paul
1
@whuber Während Wikipedia zur mathematischen Fachsprache eilt, um Präzision zu erlangen, stelle ich fest, dass Ihre Antwort, das Beispiel eines anständigen Laien, für all das, obwohl es sich lohnt, gelesen zu werden, ungefähr 16 Absätze erfordert, um ausgeführt zu werden. Aber was soll man einem Studenten sagen, der eine Antwort haben möchte, deren Lesen 5 Sekunden dauert? Kunden schätzen die Kürze der Definitionen.
Paul
5
Es ist eine messbare reelle Funktion auf einem Wahrscheinlichkeitsraum. Mit jedem dieser Fachbegriffe - "messbare", "reelle Funktion" und "Wahrscheinlichkeitsraum" - habe ich schätzungsweise 90% des potenziellen Publikums verloren, sodass nur 0,1% die Definition tatsächlich verstehen und schätzen. Das ist übrigens eine rein mathematische Definition. Es ist nutzlos, bis man angegeben hat, wie es auf ein reales statistisches Problem angewendet werden kann - aber es ist zumindest richtig (wenn nicht ganz allgemein).
Whuber
69

Einführung

Beim Nachdenken über einen jüngsten Kommentar stelle ich fest, dass alle Antworten bisher unter der Verwendung von undefinierten Begriffen wie "Variable" und vagen Begriffen wie "Unbekannt" leiden oder sich auf technische mathematische Konzepte wie "Funktion" und "Wahrscheinlichkeitsraum" beziehen. Was sollen wir der nicht-mathematischen Person sagen, die eine einfache, intuitive und dennoch genaue Definition von "Zufallsvariablen" haben möchte? Nach einigen Vorbemerkungen, die ein einfaches Modell zufälliger Phänomene beschreiben, stelle ich eine Definition bereit, die kurz genug ist, um auf eine Zeile zu passen. Da dies den Cognoscenti möglicherweise nicht vollständig befriedigt , wird im Anschluss erklärt, wie dies auf die übliche technische Definition ausgeweitet werden kann.

Tickets in einer Box

Eine Möglichkeit, sich der Idee hinter einer Zufallsvariablen zu nähern , besteht darin, sich an das Ticket-in-a-Box-Modell der Zufälligkeit zu wenden . Dieses Modell ersetzt ein Experiment oder eine Beobachtung durch eine Schachtel voller Tickets. Auf jedem Ticket steht ein mögliches Ergebnis des Experiments. (Ein Ergebnis kann so einfach wie "Kopf" oder "Zahl" sein. In der Praxis ist es jedoch komplexer, z. B. die Geschichte der Aktienkurse, die vollständige Aufzeichnung eines langen Experiments oder die Abfolge aller Wörter in einem Dokument .) Alle möglichen Ergebnisse erscheinen mindestens einmal unter den Tickets; Einige Ergebnisse können auf vielen Tickets angezeigt werden.

Anstatt das Experiment tatsächlich durchzuführen, stellen wir uns vor, alle Tickets gründlich - aber blind - zu mischen und nur eine auszuwählen. Wenn wir zeigen können, dass sich das reale Experiment so verhalten sollte, als würde es auf diese Weise durchgeführt, haben wir ein potenziell kompliziertes (und teures und langwieriges) Experiment in der realen Welt auf ein einfaches, intuitives Gedankenexperiment (oder "statistisches Modell" ) reduziert "). Die Klarheit und Einfachheit dieses Modells ermöglicht die Analyse des Experiments.

Ein Beispiel

Standardbeispiele betreffen die Ergebnisse des Werfens von Münzen und Würfeln und des Ziehens von Spielkarten. Diese sind aufgrund ihrer Trivialität etwas ablenkend. Nehmen wir an, wir sind besorgt über das Ergebnis der US-Präsidentschaftswahlen im Jahr 2016. Als (winzige) Vereinfachung gehe ich davon aus, dass eine der beiden großen Parteien - Republikaner (R) oder Demokratisch (D) - wird gewinnen. Da das Ergebnis (mit den derzeit verfügbaren Informationen) ungewiss ist, stellen wir uns vor, dass Tickets in eine Schachtel gelegt werden: einige mit "R" und andere mit "D". Unser Modell des Ergebnisses ist es, genau ein Ticket aus dieser Box zu ziehen.

Es fehlt etwas: Wir haben noch nicht festgelegt, wie viele Tickets es für jedes Ergebnis geben wird. Dies herauszufinden ist in der Tat das Hauptproblem der Statistik: Basierend auf Beobachtungen (und der Theorie), was kann über die relativen Anteile der einzelnen Ergebnisse in der Box gesagt werden?

(Ich hoffe, es ist klar, dass die Proportionen jeder Art von Ticket in der Box ihre Eigenschaften bestimmen und nicht die tatsächlichen Zahlen jeder Art von Ticket. Die Proportionen sind - wie üblich - definiert als die Anzahl jeder Art von Ticket geteilt durch Die Gesamtzahl der Tickets: Beispielsweise verhält sich eine Box mit einem "D" -Ticket und einem "R" -Ticket genau wie eine Box mit einer Million "D" -Tickets und einer Million "R" -Tickets 50% aller Tickets und somit jeweils eine 50% ige Chance, gezogen zu werden, wenn die Tickets gründlich gemischt werden.)

Das Modell quantitativ machen

Aber lassen Sie uns diese Frage hier nicht weiter verfolgen, da wir nahe an unserem Ziel sind, eine Zufallsvariable zu definieren. Das Problem mit dem Modell ist bisher, dass es nicht quantifizierbar ist, während wir damit quantitative Fragen beantworten möchten. Und damit meine ich auch keine trivialen, sondern reale, praktische Fragen wie: "Wenn mein Unternehmen eine Milliarde Euro in die Entwicklung fossiler Offshore-Brennstoffe in den USA investiert hat, um wie viel wird sich der Wert dieser Investition infolge der Wahlen 2016 ändern?" ? " In diesem Fall ist das Modell so einfach, dass wir nicht viel tun können, um eine realistische Antwort auf diese Frage zu erhalten. Wir könnten jedoch so weit gehen, unsere Wirtschaftspersonal zu konsultieren und ihre Meinung zu den beiden möglichen Ergebnissen einzuholen:

  1. Wenn die Demokraten gewinnen, wie stark wird sich die Investition ändern? (Angenommen, die Antwort lautet Dollar.)d

  2. Wenn die Republikaner gewinnen, wie stark wird sich das ändern? (Angenommen, die Antwort lautet Dollar.)r

Die Antworten sind Zahlen. Um sie in dem Modell zu verwenden, werde ich meine Mitarbeiter bitten, alle Tickets in der Box durchzugehen und auf jedem "D" -Ticket " Dollars" und auf jedem "R" -Ticket " Dollars" zu schreiben . Jetzt können wir die Unsicherheit der Investition klar und quantitativ modellieren: Ihre Wertänderung nach der Wahl entspricht dem Erhalt des Geldbetrags, der auf ein einzelnes Ticket geschrieben wurde, das zufällig aus dieser Box gezogen wurde.rdr

Dieses Modell hilft uns, zusätzliche Fragen zur Investition zu beantworten. Zum Beispiel, wie unsicher sollten wir über die Investition des Wert sein ? Obwohl es (einfache) mathematische Formeln für diese Unsicherheit gibt, können wir ihre Antworten einigermaßen genau reproduzieren, indem wir unser Modell wiederholt - vielleicht tausendmal - verwenden, um zu sehen, welche Arten von Ergebnissen tatsächlich auftreten, und um ihre Streuung zu messen. Ein Ticket-in-a-Box-Modell gibt uns die Möglichkeit, unsichere Ergebnisse quantitativ zu beurteilen.

Zufällige Variablen

Um quantitative Antworten zu unsicheren oder variablen Phänomenen zu erhalten, können wir ein Ticket-in-a-Box-Modell anwenden und Zahlen auf die Tickets schreiben. Dieser Prozess des Schreibens von Zahlen muss nur einer einzigen Regel folgen: Er muss konsistent sein. In diesem Beispiel muss auf jedem demokratischen Ticket " Dollars" stehen - ausnahmslos - und auf jedem republikanischen Ticket müssen " Dollars" stehen.rdr

Eine Zufallsvariable ist eine konsistente Methode, um Zahlen auf Tickets in eine Box zu schreiben.

(Die mathematische Notation dafür ist, dem Umnummerierungsprozess einen Namen zu geben , typischerweise mit einem lateinischen Großbuchstaben wie oder Die auf den Tickets geschriebenen Identifikationsinformationen werden oft mit kleinen Buchstaben benannt, typischerweise (griechisches Omega in Kleinbuchstaben) "). Der Wert, der mit der Zufallsvariablen dem Ticket ist, wird mit . Im Beispiel könnte man dann sagen, dass" eine Zufallsvariable ist, die die Änderung des Werts der Investition darstellt Msgstr "" "Es würde vollständig spezifiziert, indem undY ω X ω X ( ω ) X X ( D ) = D X ( R ) = R X X XXYωXωX(ω)XX(D)=dX(R)=r. In komplizierteren Fällen werden die Werte von durch kompliziertere Beschreibungen und häufig durch Formeln angegeben. Beispielsweise können die Tickets einen Jahresschlusskurs einer Aktie darstellen, und die Zufallsvariable kann der Wert eines Derivats dieser Aktie zu einem bestimmten Zeitpunkt sein, z. B. eine Verkaufsoption. Der Optionsvertrag beschreibt, wie berechnet wird. Optionshändler verwenden genau diese Art von Modell, um ihre Produkte zu bewerten.)XXX

X

X


Danach: über Messbarkeit

Wenn die Definition einer Zufallsvariablen mit der Einschränkung "messbar" einhergeht, hat der Definierer eine Verallgemeinerung des Ticket-in-a-Box-Modells auf Situationen mit unendlich vielen möglichen Ergebnissen im Sinn. (Technisch gesehen wird es nur bei unzähligen Endpunkten benötigt oder wenn irrationale Wahrscheinlichkeiten involviert sind, und selbst im letzteren Fall kann es vermieden werden.) Bei unendlich vielen Endpunkten ist es schwierig zu sagen, wie hoch der Anteil an der Gesamtsumme sein würde. Wenn es unendlich viele "D" -Karten und unendlich viele "R" -Karten gibt, wie sind ihre relativen Anteile? Wir können es nicht mit einer bloßen Teilung einer Unendlichkeit durch eine andere herausfinden!

In diesen Fällen müssen die Proportionen auf andere Weise angegeben werden. Eine "messbare" Menge von Tickets ist jede Sammlung von Tickets in der Box, für die ihr Anteil definiert werden kann. Wenn dies geschehen ist, wird die Zahl, die wir als "Proportion" betrachtet haben, als "Wahrscheinlichkeit" bezeichnet. (Nicht mit jeder Sammlung von Tickets muss eine Wahrscheinlichkeit verbunden sein.)

XX(ω)abab

whuber
quelle
7
Ein kurzes interaktives Lernprogramm auf meiner Website unter quantdec.com/envstats/notes/class_06/tutorial.htm bietet denjenigen, die mit Zufallsvariablen oder Ticket-in-a-Box-Modellen noch nicht vertraut waren, praktische Informationen und einige zusätzliche Konzepte.
whuber
2
Ein Beispiel für diese Konzepte finden Sie unter stats.stackexchange.com/a/68782 .
whuber
2
NB Ich vermute, dass viele Leute den Begriff "Bevölkerung" ungefähr im Sinne der Tickets in einer Schachtel verwenden. Ich vermeide diese Terminologie, weil es so klingt, als könnten wir nur Wahrscheinlichkeitsmodelle für die Stichprobe tatsächlicher (physischer) Populationen erstellen. Selbst wenn eine physische Population beprobt wird, gibt es selten eine perfekte Eins-zu-Eins-Entsprechung zwischen ihr und den Tickets. Zum Beispiel wird niemand jemals in der Lage sein, die am 1. Januar 2014 lebenden Chinesen aufzuzählen, auch nicht wegen der Ungewissheit, wann Menschen geboren werden, wann sie sterben und ob sie Chinesen sind.
whuber
4
@jsk Das Intro zu dieser Antwort erklärt, warum solche Sorgfalt notwendig schien. Obwohl es wahr ist, dass zwei andere Antworten in diesem Thread eine korrekte und vollständige Definition enthalten ("eine messbare Funktion von einem Wahrscheinlichkeitsraum in einen messbaren Raum, der als Zustandsraum bekannt ist"), erfordert diese Definition implizit das Verständnis der Vorkenntnisse über Sigma-Algebren, Wahrscheinlichkeitsmaße, und messbare Funktionen. Die Leser werden sich beschweren, "das ist Zeug für Hochschulabsolventen" .
whuber
4
@ user4205580 Für eine rein mathematische Definition ist "Konsistenz" überhaupt nicht erforderlich, da für den Mathematiker die Zufallsvariable einfach "gegeben" ist. Für statistische Anwendungen, wie hier beschrieben, ist dies eine wichtige Bedingung, da viele Daten nicht numerisch sind: Zufallsvariablen müssen in einer Weise konstruiert werden, die für das Modell und die analytischen Ziele geeignet ist. Sie können selbst entscheiden, ob diese konzeptionelle Unterscheidung für Sie von Nutzen ist.
whuber
16

Informell ist eine Zufallsvariable eine Möglichkeit, jedem möglichen Ergebnis einen numerischen Code zuzuweisen. *

Beispiel 1

{H,T}

XX(H)=1X(T)=010

Beispiel 2

{A,K,,2,A,K,,2,A,K,,2,A,K,,2}.

In der Brücke zählt ein Ass 4 hohe Kartenpunkte, ein König 3, eine Dame 2 und ein Bube 1. Jede andere Karte zählt 0 Punkte.

YY(A)=4Y(J)=1Y(7)=0


HTA

* Formal ist eine Zufallsvariable eine Funktion, die jedes Ergebnis (im Stichprobenraum) einer reellen Zahl zuordnet.

Kenny LJ
quelle
5
+1. Diese Antwort kommt auf den Punkt, ist richtig und klar - wodurch der Unsinn über "unbekannte" und "sich ändernde" Werte vermieden wird, der die anderen Antworten in diesem Thread durchdringt.
Whuber
12

Im Gegensatz zu einer regulären Variablen darf eine Zufallsvariable nicht durch einen einzigen, unveränderlichen Wert ersetzt werden. Vielmehr können statistische Eigenschaften wie die Verteilung der Zufallsvariablen angegeben werden. Die Verteilung ist eine Funktion, die die Wahrscheinlichkeit angibt, mit der die Variable einen bestimmten Wert annimmt oder in einen Bereich fällt, der bestimmte Parameter wie den Mittelwert oder die Standardabweichung enthält.

Zufallsvariablen können als diskret klassifiziert werden, wenn die Verteilung Werte aus einer zählbaren Menge beschreibt, z. B. die ganzen Zahlen. Die andere Klassifizierung für eine Zufallsvariable ist stetig und wird verwendet, wenn die Verteilung Werte aus einer unzähligen Menge wie die reellen Zahlen abdeckt.

Sharpie
quelle
2
Es ist wahrscheinlich am besten, den Begriff "normale Variable" hier nicht zu verwenden, wenn Sie keine normalverteilte Zufallsvariable meinen.
Rob Hyndman
Einverstanden. Obwohl ich persönlich jemanden für ein paar Sekunden komisch ansah, wenn er "normale Variable" sagte und nicht irgendwo das Wort "zufällig" oder "verteilt" hineinwarf, um mich darauf hinzuweisen, dass es das ist, worüber er sprach. Ich bin aber auch Ingenieur und kein Statistiker, daher verwende ich nicht so viele domänenspezifische Notationen.
Sharpie
7
Zufallsvariablen können als diskret eingestuft werden, wenn sie nicht auf sich aufmerksam machen. Wenn sie nur zählbar sind, sagen wir diskret: -P Sie meinen auch, verschreiben, anstatt zu verbieten, aber ich denke, beschreiben könnte geeigneter sein. Trotzdem eine gute Antwort - hoffentlich hilft +1 dabei, das Nitpicking einzudämmen!
Walkytalky
@walkytalky Danke für die Korrekturen - ich habe einige Korrekturen vorgenommen.
Sharpie
1
Jede Variable ist ein Platzhalter für einen Wert. Sie können diesen oder jenen Wert einer Variablen zuweisen (manchmal wird die Menge der Werte, die Sie zuweisen können, durch eine Menge eingeschränkt, die als Typ bezeichnet wird ). Variablen, die einen einzigen, unveränderlichen Wert behalten, werden als "Konstanten" bezeichnet. Wollten Sie vielleicht sagen, dass eine Zufallsvariable einen bekannten Wert behält, während der Wert einer Zufallsvariablen unbekannt ist? Dies steht im Widerspruch zu den anderen Antworten, wonach eine Zufallsvariable überhaupt keine Variable ist - es ist eine Funktion, die (deterministisch) einen unbekannten Zustand auf etwas anderes abbildet. Es ist nicht zufällig und es ist keine Variable, heißt es.
Val
6

Mir wurde diese Geschichte erzählt:

Eine Zufallsvariable kann mit dem Heiligen Römischen Reich verglichen werden: Das Heilige Römische Reich war nicht heilig, es war nicht römisch und es war kein Reich.

Ebenso ist eine Zufallsvariable weder zufällig noch eine Variable. Es ist nur eine Funktion. (Die Geschichte wurde hier erzählt: Quelle ).

Dies ist zumindest eine schnelle Art zu erklären, die den Menschen helfen könnte, sich zu erinnern!

kjetil b halvorsen
quelle
3

Aus Wikipedia :

In der Mathematik (insbesondere Wahrscheinlichkeitstheorie und Statistik) ist eine Zufallsvariable (oder stochastische Variable) (im Allgemeinen) eine messbare Funktion, die einen Wahrscheinlichkeitsraum in einen messbaren Raum abbildet. Zufallsvariablen, die alle möglichen Ergebnisse eines Ereignisses in die reellen Zahlen abbilden, werden häufig in der Elementarstatistik untersucht und in den Naturwissenschaften verwendet, um Vorhersagen auf der Grundlage von Daten aus wissenschaftlichen Experimenten zu treffen. Neben wissenschaftlichen Anwendungen wurden Zufallsvariablen zur Analyse von Glücksspielen und stochastischen Ereignissen entwickelt. Die Nützlichkeit von Zufallsvariablen beruht auf ihrer Fähigkeit, nur die mathematischen Eigenschaften zu erfassen, die zur Beantwortung probabilistischer Fragen erforderlich sind.

Von cnx.org :

Eine Zufallsvariable ist eine Funktion, die allen möglichen Ergebnissen eines Zufallsexperiments unter festgelegten Bedingungen eindeutige numerische Werte zuweist. Eine Zufallsvariable ist keine Variable, sondern eine Funktion, die Ereignisse auf Zahlen abbildet.

Mehper C. Palavuzlar
quelle
4
Keine der cnx.org-Definitionen ist korrekt: die erste aufgrund der vagen und möglicherweise irreführenden Verwendung von "eindeutigen" und "festen Bedingungen" und die zweite, weil sie einfach falsch ist; Ein RV wird anhand von Ergebnissen (Elementen des Stichprobenraums) und nicht anhand von Ereignissen (messbaren Ergebnissätzen) definiert.
Whuber
P=κλeλtκ=0P(t)dtED(t)=λeλtED(t)
1
f(x)
3

Eine Zufallsvariable, normalerweise mit X bezeichnet, ist eine Variable, bei der das Ergebnis ungewiss ist. Die Beobachtung eines bestimmten Ergebnisses dieser Variablen wird als Realisierung bezeichnet. Genauer gesagt ist es eine Funktion, die einen Wahrscheinlichkeitsraum in einen messbaren Raum abbildet, der üblicherweise als Zustandsraum bezeichnet wird. Zufallsvariablen sind diskret (können mehrere unterschiedliche Werte annehmen) oder kontinuierlich (können unendlich viele Werte annehmen).

Betrachten Sie die Zufallsvariable X, die die Summe ist, die beim Würfeln von zwei Würfeln erhalten wird. Es kann jeder der Werte 2-12 annehmen (mit gleicher Wahrscheinlichkeit bei fairen Würfeln) und das Ergebnis ist ungewiss, bis die Würfel gewürfelt werden.

Graham Cookson
quelle
5
Nur ein Gedanke, aber das liest sich so, als ob Sie sagen, dass die Wahrscheinlichkeit, eine 12 (1/36) zu würfeln, die gleiche ist wie eine 7 (1/6).
Jefflovejapan
0

Während meines Studiums an einer anderen Universität als der Mathematik wurde uns gesagt, dass eine Zufallsvariable eine Karte von Werten ist, die eine Variable für die Wahrscheinlichkeiten annehmen kann. Dies erlaubte es, die Wahrscheinlichkeitsverteilungen zu zeichnen

http://mathbits.com/MathBits/TISection/Statistics2/normaldistribution.htm

Kürzlich habe ich gemerkt, wie anders sich das von den Mathematikern unterscheidet. Es zeigt sich, dass sie mit der Zufallsvariablen eine einfache Funktion X: Ω → R meinen, die ein Element des Probenraums Ω ​​(auch als Ergebnis, Ticket oder Einzelperson bezeichnet , wie oben erläutert) in eine reelle Zahl R im Bereich übersetzt ( -∞, ∞). Das heißt, es wurde treffend oben angemerkt, dass es nicht zufällig und überhaupt nicht variabel ist. Die Zufälligkeit wird normalerweise mit dem Wahrscheinlichkeitsmaß P als Teil des Maßraums (Ω, P) angegeben. P bildet Abtastwerte auf R ab, ähnlich wie eine Zufallsvariable, aber dieser Zeitbereich ist auf [0,1] begrenzt, und wir können sagen, dass eine Zufallsvariable (Ω, P) in (R, P) übersetzt, und somit ist eine Zufallsvariable mit einer Wahrscheinlichkeit ausgestattet messen Sie P: R -> [0,1], damit Sie für jedes x in R die Wahrscheinlichkeit seines Auftretens angeben können.

Ich weiß nicht, warum Sie diese Art von Zufallsvariablen benötigen und warum Sie die Elemente von R überhaupt nicht abtasten können, aber es scheint, dass wir durch die Übersetzung von Samples in numerische Werte die Samples ordnen, die Verteilung zeichnen und die Erwartung berechnen können. Ich habe die Idee, ein Tutorial zur Maßtheorie (Measure Theory for Dummies) zu lesen. Vielleicht haben Mathematiker bessere Anwendungen von Zufallsvariablen im Sinn, aber ich kann sie in meiner überflüssigen Studie nicht finden. Aus demselben Text geht hervor, dass Sie Samples nicht immer in Zahlen konvertieren müssen, insbesondere um die Entropie für das Alphabet zu berechnenΩ

H(Ω)=P(Ωi)ln(Ωi)

Das Integral benötigt keine reellen Werte der Zufallsvariablen.

Val
quelle
XAσA