Normalerweise Abtastung vom Standard-Simplex

7

Ich möchte in der Lage sein, Werte aus einer dimensionalen multivariaten Gaußschen Verteilung zu generieren mit gegebenen Mitteln und einer Kovarianzmatrix auf den Bereich abgeschnitten ist, so dass sie sich zu eins summieren.n[0,1]

Ich denke, dies ist dasselbe wie das Abtasten aus dem Standard- Implex nach der Gaußschen Verteilung, aber wie würde ich vorgehen?n

sam10269
quelle
Vielen Dank für Ihre schnelle Antwort. Ich habe versucht, damit zufällig Gewichtungen gemäß einem Normalwert zu generieren. Eine weitere Einschränkung wären also alle Werte zwischen 0 und 1, sodass dies zu einer abgeschnittenen Verteilung führen würde. Ich hatte auch gehofft, diese später weiter verfeinern zu können, z. X1 zwischen .2 und .3, aber ich habe zuerst versucht, die Hauptidee auf den Punkt zu bringen.
Sam10269
Ich versuche, verschiedene Vermögenswerte eines Anlageportfolios zu simulieren. Ich gehe von Normalität für jedes Asset aus, daher möchte ich, dass die gesamte multivariate Verteilung normal ist und die Gewichtung für jedes Asset auf 1 summiert. Statistiken waren nie meine Stärke. Ich entschuldige mich, wenn dies der falsche Weg ist.
Sam10269
5
Ich habe Ihre Frage bearbeitet, um die Informationen hinzuzufügen, von denen Sie sprechen, dass die Normalverteilung abgeschnitten ist. PS Überprüfen Sie hier, um mehr über die Dirichlet-Verteilung zu erfahren, da dies normalerweise eine "Verteilung der Wahl" für solche Probleme ist.
Tim
sampling from the standard n-simplex according to the Gaussian distributionist ein Widerspruch zu Begriffen, da die Gaußsche Verteilung im gesamten Raum definiert ist. Rp
Xi'an
Um die Frage genau zu stellen, können Sie bitte die Dichte aufschreiben, die Sie auf dem Standard- Implex simulieren möchten ? n
Xi'an

Antworten:

3

In diesen Artikeln wird beschrieben, wie aus einem multivariaten Normal, das auf einem (p - 1) Simplex abgeschnitten ist, eine Stichprobe erstellt wird ([ http://ieeexplore.ieee.org/abstract/document/6884588/] , [dobigeon.perso.enseeiht.fr/papers/ Dobigeon_TechReport_2007b.pdf]). Die Probenahme erfolgt über Gibbs-Probenahme oder HMC. Kurz gesagt, es werden Ideen aus der (bedingten) multivariaten Normalverteilung verwendet. Angenommen, Sie möchten einen Vektor abtasten, der einer multivariaten Normalen entspricht, die auf einem Simplex abgeschnitten sind , dh . Sie können die Komponente ( ) , die von abhängig ist (dh die verbleibenden Komponenten vonα(p×1)p1αN(μ,Σ)I(αSp1)jthαjαjα ) und setze die letzte Komponente ( ) auf mit dem bedingten Mittelwert und der bedingten Varianz . Die Papiere, die ich erwähnte, beschreiben, wie man diese berechnet. Beachten Sie, dass es nur Informationen gibt.pth1j=1p1αjμj|jΣj|jp1

Napo Vargas
quelle
2

Es hört sich so an, als ob Sie die logit-Normalverteilung wollen . Diese Verteilung zeigt sich häufig in der Compositional Data Analysis (CDA). CDA wird in der Geologie häufig verwendet, um die Zusammensetzung von Mineralien in Boden- oder Gesteinsproben zu messen. Die logit-Normal nimmt eine logit-Transformation Ihrer Zufallsvariablen und diese logit-transformierte Zufallsvariable ist eine normalverteilte Zufallsvariable. Formal,

Y=log(X1X)

Dabei ist logit-normal und normal. Multivariate Erweiterungen existieren und sind die am häufigsten verwendeten Formen der Dichte.XY

Wenn dies nicht das ist, was Sie wollen, und Sie wirklich wollen, dass eine normale Zufallsvariable, die durch eine Sammlung von Einschränkungen eingeschränkt wird, immer 1 ergibt und alle Einträge nicht negativ sind, müssen Sie auf andere Simulationstechniken zurückgreifen, um Zeichnungen zu erhalten aus der Verteilung. Es ist ziemlich kompliziert, diese Ziehungen durchzuführen. John Geweke schrieb ein Papier darüber und Christian Robert schrieb auch ein Papier über Stichproben aus dieser Art der Verteilung.

Lucas Roberts
quelle
Vielen Dank für die Referenzen. Unsere parallelen Papiere befassten sich mit Einschränkungen für offene Sets. Die Behandlung des Nullmaßes, dass die Summe der Komponenten eins ergibt, wird meines Erachtens von unserem Ansatz nicht abgedeckt.
Xi'an
@ Xi'an, Als ich diese Antwort schrieb, wurde die Frage nicht geklärt, ob sie versuchten, aus einer Verteilung mit Kürzungen zu probieren, von denen ich glaube, dass Ihr Artikel über John Gewekes Adresse oder über einen Wahrscheinlichkeits-Simplex wie den Logit- normal oder keines und tatsächlich ein Gaußscher mit Simplex-Einschränkungen. Es scheint nun, dass das OP von letzterem probieren möchte; multivariater Gaußscher Wert mit Simplex-Einschränkungen über dem Gaußschen Wert (Nicht-Negativität und Summe zu 1-Einschränkungen müssen erfüllt sein). Leider befasst sich keiner der hier skizzierten Ansätze mit der Frage des OP.
Lucas Roberts