Ich frage mich, ob es Standardverteilungen für Teilmengen von Ganzzahlen . Entsprechend könnten wir dies als Verteilung auf einen Längenvektor von binären Ergebnissen ausdrücken , z. B. wenn dann entspricht dem Vektor .
Im Idealfall suche ich eine Verteilung , die aus einer Familie stammt, die durch einen endlichen dimensionalen Parameter indiziert ist und deren Masse so verteilt, dass zwei binäre Vektoren und ähnlich sind Wahrscheinlichkeit, wenn sie "nahe" beieinander liegen, dh und haben ähnliche Wahrscheinlichkeiten. Wirklich, was ich hoffentlich tun möchte, ist, einen Prior zu geben, so dass, wenn ich weiß, dass ziemlich groß ist, wahrscheinlich relativ zu Vektoren weit weg von groß ist .
Eine Strategie, die mir in den Sinn kommt, wäre, eine Metrik oder ein anderes Maß für die Streuung auf auf und dann oder ähnliches. Ein explizites Beispiel wäre in Analogie zur Normalverteilung. Das ist in Ordnung, aber ich hoffe, dass es etwas Standardisches gibt, das der Bayes'schen Analyse zugänglich ist. damit kann ich die normalisierungskonstante nicht aufschreiben.
quelle
Antworten:
Möglicherweise bevorzugen Sie Standortfamilien basierend auf der Hamming-Entfernung aufgrund ihres Reichtums, ihrer Flexibilität und ihrer Rechenleistung.
Notation und Definitionen
Denken Sie daran, dass in einem freien endlichdimensionalen Modul mit der Basis der Hamming-Abstand zwischen zwei Vektoren liegt und ist die Anzahl der Stellen wo .V (e1,e2,…,eJ) δH v=v1e1+⋯+vJeJ w=w1e1+⋯+wJeJ i vi≠wi
Bei gegebenem Ursprung der Hamming-Abstand in Kugeln , , wobei . Wenn der Erdungsring hat Elemente hat - Elemente und hat - Elemente. (Dies folgt unmittelbar aus der Beobachtung, dass sich Elemente von an genau Stellen von unterscheiden - von denen esv0∈V V Si(v0) i=0,1,…,J Si(v0)={w∈V | δH(w,v0)=i} n V nJ Si(v) (Ji)(n−1)i Si(v) v i (Ji) Möglichkeiten - und dass es unabhängig Werte für jeden Ort gibt.)n−1
Die affine Übersetzung in wirkt sich natürlich auf ihre Verteilungen aus, um Standortfamilien zu erhalten. Insbesondere wenn eine beliebige Verteilung auf (was wenig mehr als , für alle und ) und ist ein beliebiges Element von , dann ist auch eine Verteilung woV f V f:V→[0,1] f(v)≥0 v∈V ∑v∈Vf(v)=1 w V f(w)
für alle . Ein Ort Familien von Verteilungen invariant ist im Rahmen dieser Aktion: impliziert für alle .v∈V Ω f∈Ω f(v)∈Ω v∈V
Konstruktion
Dies ermöglicht es uns, potenziell interessante und nützliche Verteilungsfamilien zu definieren, indem wir ihre Formen an einem festen Vektor als und Übersetzen dieser "erzeugenden Verteilungen" unter der Wirkung von , um die vollständige Familie . Um die gewünschte Eigenschaft zu erreichen, dass an nahe gelegenen Punkten vergleichbare Werte haben sollte, benötigen Sie einfach diese Eigenschaft aller erzeugenden Verteilungen.v 0=(0,0,…,0) V Ω f
Um zu sehen, wie dies funktioniert, konstruieren wir die Standortfamilie aller Verteilungen, die mit zunehmender Entfernung abnehmen. Da nur Hamming-Entfernungen möglich sind, berücksichtigen Sie eine abnehmende Folge nicht negativer reeller Zahlen = . einstellenJ+1 a 0≠a0≥a1≥⋯≥aJ≥0
und definieren Sie die Funktion durchfa:V→[0,1]
Dann wird , wie ist einfach zu überprüfen, ist eine Verteilung auf . Außerdem ist genau dann, wenn ein positives Vielfaches von (als Vektoren in ). Wenn wir möchten, können wir also auf standardisieren .fa V fa=fa′ a′ a RJ+1 a a0=1
Dementsprechend liefert diese Konstruktion eine explizite Parametrisierung aller derartigen ortsinvarianten Verteilungen, die mit der Hamming-Entfernung abnehmen: Jede solche Verteilung hat die Form für eine Sequenz und einige Vektor .f(v)a a=1≥a1≥a2≥⋯≥aJ≥0 v∈V
Diese Parametrisierung kann eine bequeme Angabe von Prioritäten ermöglichen: Berücksichtigen Sie diese in einem Prior an der Position und einem Prior an der Form . (Natürlich könnte man eine größere Anzahl von Prioritäten in Betracht ziehen, bei denen Ort und Form nicht unabhängig sind, aber dies wäre ein komplizierteres Unterfangen.)v a
Zufallswerte generieren
Eine Möglichkeit, aus zu probieren, besteht darin, es in eine Verteilung über das sphärische Strahl und eine andere Verteilung zu zerlegen, die von jeder Kugel abhängig ist:f(v)a
Zeichnen Sie einen Index aus der diskreten Verteilung auf die durch die Wahrscheinlichkeiten , wobei wie zuvor definiert ist .i {0,1,…,J} (Ji)(n−1)iai/A A
Der Index entspricht der Menge von Vektoren, die sich an genau Stellen von unterscheiden . Wählen Sie daher die Stellen aus den möglichen Teilmengen und geben Sie jede gleiche Wahrscheinlichkeit an. (Dies ist nur eine Auswahl von Indizes aus ohne Ersatz.) Lassen Sie diese Teilmenge von Stellen schreiben .i v i i (Ji) i J i I
Zeichnen Sie ein Element indem Sie unabhängig einen Wert einheitlich aus der Menge der Skalare für alle nicht gleich und ansonsten . Erstellen Sie entsprechend einen Vektor indem Sie gleichmäßig zufällig aus den Skalaren ungleich Null auswählen, wenn und andernfalls . Setze .w wj vj j∈I wj=vj u uj j∈I uj=0 w=v+u
Schritt 3 ist im Binärfall nicht erforderlich.
Beispiel
Hier ist eine
R
Implementierung zur Veranschaulichung.Als Beispiel für seine Verwendung:
Es dauerte Sekunden, um iid-Elemente aus der Verteilung zu zeichnen, wobei , (der binäre Fall), und nimmt exponentiell ab.0.2 104 f(v)a J=10 n=2 v=(1,1,…,1) a=(211,210,…,21)
(Dieser Algorithmus erfordert nicht, dass abnimmt. Daher werden zufällige Variablen aus jeder Standortfamilie generiert , nicht nur aus den unimodalen.)a
quelle
Eine Stichprobe aus einem k-determinanten Punktprozess modelliert eine Verteilung über Teilmengen, die die Diversität fördert, sodass ähnliche Elemente in der Stichprobe weniger wahrscheinlich zusammen auftreten. Siehe K-Determinanten-Punkt-Prozess-Sampling von Alex Kulesza, Ben Taskar.
quelle