Ist Erwartung gleich Mittelwert?

11

Ich mache ML an meiner Universität, und der Professor erwähnte den Begriff Erwartung (E), während er versuchte, uns einige Dinge über Gaußsche Prozesse zu erklären. Aber von der Art, wie er es erklärte, verstand ich, dass E dasselbe ist wie der Mittelwert μ. Habe ich richtig verstanden?

Wenn es dasselbe ist, wissen Sie dann, warum beide Symbole verwendet werden? Ich habe auch gesehen, dass E als Funktion wie E ( x2 ) verwendet werden kann, aber ich habe das für μ nicht gesehen.

Kann mir jemand helfen, den Unterschied zwischen den beiden besser zu verstehen?

Jim Blum
quelle
Für stetiges ist E [ X ] = - f ( x ) x d x = μ ( x ), wobei f ( x ) die Wahrscheinlichkeitsdichtefunktion ist. Es ist also nur wahr, wenn X das Argument ist. Es könnte jedoch auch wahr sein, wenn wir E [ g ( X ) ] = E [ X ] = μ ( X ) haben , wobeiXE[X]=f(x)xdx=μ(x)f(x)XE[g(X)]=E[X]=μ(X) ist etwas anderes als die Identitätsfunktion. g
Jase
1
@Jase ? Warum ist die rechte Seite eine Funktion von x , die nach dem Ersetzen der Grenzen bei der Bewertung des Integrals verschwunden sein sollte? μ(x)x
Dilip Sarwate
1
@ DilipSarwate war ein Tippfehler. Das heißt μ = μ ( X ) . μ(x)μ=μ(X)
Jase
2
John: Wenn ich Sie wäre, würde ich die Grundwahrscheinlichkeit lernen, bevor ich an Kursen für maschinelles Lernen / Gaußsche Prozesse teilnehme. Schauen Sie sich dieses Buch an: math.uiuc.edu/~r-ash/BPT.html
Zen
Vielen Dank Jungs für eure Hilfe! Ich habe nicht so viel Feedback erwartet. @ Zen Vielen Dank für Ihren Rat. Ich stimme dir vollkommen zu. Ich habe ein Modul als Grundstudium für Wahrscheinlichkeiten und Statistiken absolviert. Wir hatten jedoch nur eine einfache Einführung in Verteilungen und Wahrscheinlichkeiten, und leider haben wir sie nicht ausführlich behandelt. Außerdem haben wir den Begriff "Erwartung" nicht erwähnt. Ich versuche jetzt, meine Lücken bei Statistiken und Wahrscheinlichkeiten selbst zu schließen.
Jim Blum

Antworten:

8

Erwartung / Erwarteter Wert ist ein Operator, der auf eine Zufallsvariable angewendet werden kann. Für diskrete Zufallsvariablen (wie Binomial) mit möglichen Werten ist es definiert als k i x i p ( x i ) . Das heißt, es ist der Mittelwert der möglichen Werte, gewichtet mit der Wahrscheinlichkeit dieser Werte. Kontinuierliche Zufallsvariablen kann als Verallgemeinerung gedacht werden: x d P . Der Mittelwert einer Zufallsvariablen ist ein Synonym für Erwartung.kikxip(xi)xdP

Die Gaußsche (Normal-) Verteilung hat zwei Parameter und σ 2 . Wenn X normalverteilt ist, ist E ( X ) = μ . Der Mittelwert einer verteilten Gaußschen Variablen ist also gleich dem Parameter μ. Dies ist nicht immer der Fall. Nehmen Sie die Binomialverteilung mit den Parametern n und p . Wenn X binomial verteilt ist, ist E ( X ) = n p .μσ2XE(X)=μμnpXE(X)=np

Wie Sie gesehen haben, können Sie auch Erwartung auf Funktionen von Zufallsvariablen anwenden , so dass für eine Gaußsche Sie , dass finden E ( X 2 ) = σ 2 + μ 2 .XE(X2)=σ2+μ2

Die Wikipedia-Seite zu erwarteten Werten ist ziemlich informativ: http://en.wikipedia.org/wiki/Expected_value

Jeremy Coyle
quelle
1
"... so dass für einen Gauß - können Sie feststellen , dass E ( X 2 ) = σ 2 + μ 2 ." Ist es absolut notwendig, dass X von Gaußian für diese Beziehung gilt? XE(X2)=σ2+μ2X
Dilip Sarwate
Die Beziehung wird immer gelten, aber ich würde die Antwort erwarten, die in Bezug auf die Parameter der Verteilung geschrieben wurde. Wenn ich also jemanden fragen würde, was E ( X 2 ) für X- verteiltes Binomial ( n , p ) ist , würde ich die Antwort n p ( 1 - p ) + ( n p ) 2 erwarten , nichtE(X2)=V(X)+E(X)2E(X2)X(n,p)np(1p)+(np)2σ2+μ2
Jeremy Coyle
Wenn Sie jedoch fragen würden, was für eine binomische Zufallsvariable mit dem Mittelwert μ und der Varianz σ 2 ist , wäre die Antwort σ 2 + μ 2 . Zugegeben, binomiale Zufallsvariablen werden normalerweise mit n und p parametrisiert , aber was nun? Aus dem Mittelwert und der Varianz können wir leicht p = 1 - Varianz findenE(X2)μσ2σ2+μ2np undn=Mittelwert
p=1variancemean
n=meanp=mean2meanvariance.
Dilip Sarwate
1
Der Sinn des Beispiels bestand darin, zwischen Parametern einer Verteilung und den Momenten einer Verteilung zu unterscheiden. Ja, es ist möglich, Verteilungen in Bezug auf ihre Momente neu zu parametrisieren, aber da das OP nach der Beziehung zwischen und μ fragte , scheint es wichtig, diese Unterscheidung fortzusetzen. Gibt es einen Grund, warum Sie sich dafür entscheiden, in diesem Punkt pedantisch zu sein? E(X)μ
Jeremy Coyle
1
Vielen Dank Jeremy! Hervorragende Antwort. Sie waren sehr hilfreich!
Jim Blum
7

Die Erwartung mit einer Operator-Notation E () (unterschiedliche Präferenzen für gute Schriftarten, römisch oder kursiv, schlicht oder ausgefallen, werden gefunden) impliziert, den Mittelwert ihrer Argumentation zu nehmen, jedoch in einem mathematischen oder theoretischen Kontext. Der Begriff geht auf Christiaan Huygens im 17. Jahrhundert zurück. Die Idee ist in weiten Teilen der Wahrscheinlichkeitstheorie und der mathematischen Statistik explizit enthalten, und beispielsweise macht Peter Whittles Buch Probability via Expectation deutlich, wie sie noch zentraler gestaltet werden könnte.

Grundsätzlich ist es nur eine Frage der Konvention, dass Mittelwerte (Durchschnittswerte) häufig auch ziemlich unterschiedlich ausgedrückt werden, insbesondere durch einzelne Symbole, und insbesondere dann, wenn diese Mittelwerte aus Daten berechnet werden sollen. Whittle verwendet jedoch in dem gerade zitierten Buch eine Notation A () für die Mittelwertbildung, und spitze Klammern um zu mittelnde Variablen oder Ausdrücke sind in der Physik üblich.

Nick Cox
quelle