Ich lese aus einem Buch, in dem die Dirchilet-Distribution vorgestellt wird, und präsentiere dann Zahlen darüber. Aber ich konnte diese Zahlen nicht wirklich verstehen. Ich habe die Figur hier unten angehängt. Was ich nicht verstehe, sind die Bedeutungen der Dreiecke.
Wenn Sie eine Funktion von 2 Variablen zeichnen möchten, nehmen Sie normalerweise den Wert von var1 und va2 und zeichnen dann den Wert des Funktionswerts dieser beiden Variablen ..., was eine Visualisierung in einer 3D-Dimension ergibt. Hier gibt es jedoch 3 Dimensionen und einen weiteren Wert für den Funktionswert, sodass eine Visualisierung im 4D-Raum möglich ist. Ich kann diese Zahlen nicht verstehen!
Ich hoffe jemand kann sie bitte klären!
BEARBEITEN: Folgendes verstehe ich aus Abbildung 2.14a nicht. Wir haben also aus K = 3 Dirichlet eine Probe Theta (die im Grunde ein Vektor ist) gezogen, das heißt: Theta = [Theta1, Theta2, Theta3]. Die Dreiecksdiagramme [Theta1, Theta2, Theta3]. Der Abstand vom Ursprung zu jedem Theta_i ist der Wert von Theta_i. Dann setzte es für jedes Theta_i einen Scheitelpunkt und verband alle drei Scheitelpunkte und machte ein Dreieck. Ich weiß, wenn ich [theta1, theta2, theta3] in dir (theta | a) stecke, bekomme ich eine Zahl, die die gemeinsame Wahrscheinlichkeit des Vektors Theta ist. Ich verstehe auch, dass die Wahrscheinlichkeit für kontinuierliche Zufallsvariablen ein Maß für eine Fläche ist. Aber hier haben wir 3 Dimensionen, so dass die gemeinsame Wahrscheinlichkeit das Maß für das Volumen des Raums von der rosa Ebene und unter ... dh der Pyramide ist. Jetzt verstehe ich nicht, welche Rolle das Dreieck hier spielt.
Antworten:
Alle Punkte im Dreieck müssen die beiden Bedingungen erfüllen: zwischen Null und Eins in jeder Dimension ( ) und alle summieren sich zu eins ( ).θ 0 + θ 1 + θ 2 = 10≤θ≤1 θ0+θ1+θ2=1
Ich habe es schließlich so verstanden:
Also zeigt (a) einen 3D-Raum mit als Koordinaten. Sie liegen nur zwischen 0 und 1.θ1,2,3
In (b) ist ein Dreieck gezeigt, dies ist unser Simplex.
(c) zeigt zwei Beispielpunkte, die auf dem Simplex "liegen", die auch das zweite Kriterium erfüllen (summiert sich zu einem).
(d) zeigt einen anderen Beispielpunkt auf dem Simplex, die gleichen Einschränkungen gelten
In (e) habe ich versucht, eine Projektion des Simplex auf ein 2D-Dreieck mit allen zuvor gezeigten Beispielpunkten zu zeigen.
Hoffe es macht jetzt mehr Sinn :)
quelle
Grafik 2.14 (a) zeigt eine Ebene, die aus drei Eckpunkten auf jeder Achse besteht. Der Abstand eines Scheitelpunkts vom Ursprung beträgt , was einer der Klassen . Der Bereich, der von der rosa Ebene und den Ebenen der Achsen umschlossen ist, ist die Wahrscheinlichkeit von (Vektor) k = 3 θθi k=3 θ . Angenommen, Sie neigen diese Ebene so, dass Sie eine Pyramide mit der rosa Ebene, der dem Leser am nächsten gelegenen Fläche, flach auf der Seite platziert haben. Unterdrücken Sie dann die dritte Dimension, die auf der Seite "herausspringt", und färben Sie stattdessen das Dreieck so, dass der Bereich mit höherer Dichte mit einem längeren Abstand von der Basis zu einer Oberfläche roter ist. Das zeigen die Grafiken 2.14 (b) und 2.14 (c). Je stärker das Rot in der Nähe eines Scheitelpunkts konzentriert ist, desto wahrscheinlicher ist die diesem Scheitelpunkt zugeordnete Klasse. Wenn sich der rote Bereich nicht in der Nähe eines Scheitelpunkts befindet, ist es ebenfalls nicht besonders wahrscheinlich, dass ein Ereignis eine höhere Wahrscheinlichkeit für eine Mitgliedschaft in einer der Klassen aufweist.
Diese Pyramide ist jedoch nur als eine einzige Realisierung der Dirichlet-Verteilung sinnvoll. Wenn Sie erneut aus derselben Verteilung zeichnen, erhalten Sie möglicherweise eine andere Pyramide mit unterschiedlichen Längen für jeden der Eckpunkte. Der Hauptunterschied zwischen (a) und (b) / (c) besteht darin, dass (a) die Wahrscheinlichkeit einer Ziehung von Vektor grafisch anzeigt . Die Diagramme (b) und (c) zeigen die Wahrscheinlichkeitsdichte für Werte im Simplex dh sie versuchen, die Wahrscheinlichkeitsdichtefunktion für alle Werte darzustellenθ θ k = 3 θ θ ∼ Dir ( α )θ θ θ k=3 θ in der Unterstützung. Eine Möglichkeit, über (b) und (c) nachzudenken, besteht darin, einen Punkt mit zusätzlicher roter Farbe entsprechend der durchschnittlichen Höhe zwischen der flachen rosa Ebene und der Oberfläche der Pyramide zu erhalten, gemittelt über viele Zeichnungen von .θ∼Dir(α)
quelle