Weitere Informationen zu diesem Thema, als Sie wahrscheinlich benötigen, finden Sie in Goodman (1962): "Die Varianz des Produkts von K Zufallsvariablen" , das Formeln sowohl für unabhängige Zufallsvariablen als auch für potenziell korrelierte Zufallsvariablen zusammen mit einigen Annäherungen herleitet. In einer früheren Veröffentlichung ( Goodman, 1960 ) wurde die Formel für das Produkt aus genau zwei Zufallsvariablen abgeleitet, die etwas einfacher (wenn auch immer noch ziemlich knorrig) ist. Wenn Sie die Ableitung verstehen möchten, ist dies möglicherweise ein besserer Ausgangspunkt .
Der Vollständigkeit halber geht es aber so.
Zwei Variablen
Es sei folgendes angenommen:
- x undy sind zwei Zufallsvariablen
- X undY sind ihre (von Null verschiedenen) Erwartungen
- V(x) undV(y) sind ihre Varianzen
- δx=(x−X)/X (und ebenfalls fürδy )
- Di,j=E[(δx)i(δy)j]
- Δx=x−X (und ebenfalls fürΔy )
- Ei,j=E[(Δx)i(Δy)j]
- G(x) ist der quadratische Variationskoeffizient:V(x)/X2 (ebenfalls fürG(Y) )
Dann gilt:
oder gleichwertig:
V(xy)=(XY)2[G(y)+G(x)+2D1,1+2D1,2+2D2,1+D2,2−D21,1]
V(xy)=X2V(y)+Y2V(x)+2XYE1,1+2XE1,2+2YE2,1+E2,2−E21,1
Mehr als zwei Variablen
Das Papier von 1960 schlägt vor, dass dies eine Übung für den Leser ist (was anscheinend das Papier von 1962 motiviert hat!).
Die Notation ist ähnlich, mit einigen Erweiterungen:
- sind die Zufallsvariablen anstelle von x und(x1,x2,…xn)xy
- M=E(∏ki=1xi)
- A=(M/∏ki=1Xi)−1
- = 0, 1 oder 2 für i = 1 , 2 , … ksii=1,2,…k
- = Anzahl der Einsen in ( s 1 , s 2 , … s ku(s1,s2,…sk)
- = Anzahl der 2er in ( s 1 , s 2 , … s km(s1,s2,…sk)
- für m = 0 und 2 u für m > 1 ,D(u,m)=2u−2m=02um>1
- C(s1,s2,…,sk)=D(u,m)⋅E(∏ki=1δsixi)
- gibt die Summe der 3 k - k - 1 Mengen von ( s 1 , s 2 , … s k ) mit 2 m + u > 1 an∑s1⋯sk3k−k−1(s1,s2,…sk)2m+u>1
Dann endlich:
V(∏i=1kxi)=∏X2i(∑s1⋯skC(s1,s2…sk)−A2)
See the papers for details and slightly more tractable approximations!
Just to add to the awesome answer of Matt Krause (in fact easily derivable from there). If x, y are independent then,
quelle
In addition to the general formula given by Matt it may be worth noting that there is a somewhat more explicit formula for zero mean Gaussian random variables. It follows from Isserlis' theorem, see also Higher moments for the centered multivariate normal distribution.
Suppose that(x1,…,xk) follows a multivariate normal distribution with mean 0 and covariance matrix Σ . If the number of variables k is odd,
E(∏ixi)=0 and
It is, in fact, possible to implement the general formula. The most difficult part appears to be the computation of the required partitions. In R, this can be done with the functionk=8 , the 34,459,425 partitions for k=9 could also be generated, but not the 654,729,075 partitions for k=10 (on my 16 GB laptop).
setparts
from the packagepartitions
. Using this package it was no problem to generate the 2,027,025 partitions forA couple of other things are worth noting. First, for Gaussian variables with non-zero mean it should be possible to derive an expression as well from Isserlis' theorem. Second, it is unclear (to me) if the above formula is robust against deviations from normality, that is, if it can be used as an approximation even if the variables are not multivariate normally distributed. Third, though the formulas above are correct, it is questionable how much the variance tells about the distribution of the products. Even fork=2 the distribution of the product is quite leptokurtic, and for larger k it quickly becomes extremely leptokurtic.
quelle