Funktionieren Sequenzen mit geringer Diskrepanz in diskreten Räumen?

9

Sequenzen mit geringer Diskrepanz in einem realen Raum ( ) scheinen ein wirklich hervorragendes Werkzeug zu sein, um einen Probenraum gleichmäßig abzutasten. Soweit ich das beurteilen kann, lassen sie sich gut auf jeden realen Raum verallgemeinern, wenn Sie eine geeignete Karte verwenden (z. B. lineare Karte). [ 0 , 1 ] [ a , b ][0,1]n[0,1][a,b]

Verallgemeinern sich solche Sequenzen auf diskrete Räume? z.B. Wenn ich einen Raum habe, der nur zwei Elemente in jeder Dimension enthält (z. B. Boolesche Schalter), kann ich dann einfach ? Was ist mit Dimensionen mit mehr Elementen? (zB ein 4-Zustands-Schalter?) Und für Räume mit unterschiedlicher Anzahl von Zuständen in jeder Dimension?[0,0.5]0; (0.5,1]1

Meine Intuition besagt, dass dies in Ordnung sein könnte, insbesondere wenn die Teilsequenz länger ist, aber dass es je nach Anzahl der Zustände für einige Sequenzen besser funktionieren könnte als für andere (z. B. kann eine Halton-Sequenz seltsame Wechselwirkungen mit einer Dimension mit haben Eine Primzahl von Zuständen oder eine Sobol'-Sequenz funktionieren möglicherweise nur für Dimensionen mit Elementen. Aber ich habe keine Tests durchgeführt.2n

Wenn dies nicht funktioniert, warum nicht?

naught101
quelle

Antworten:

2

Die kurze Antwort lautet: Ja! Es kann funktionieren und ist so einfach wie das Multiplizieren des Vektors mit einer ganzen Zahl und das Nehmen des ganzzahligen Teils jeder seiner Komponenten. mtn(0,1)dm

Die längere Antwort ist, dass Ihre Intuition korrekt ist und in der Praxis gemischte Ergebnisse erzielt, abhängig von der Wahl von:

  • welche Sequenz Sie wählen (Halton, Sobol, etc ..)
  • die Basisparameter (zB 2,3,5, ...)
  • und in geringerem Maße der Wert von .m

Ich habe jedoch kürzlich einen ausführlichen Blog-Beitrag geschrieben: "Die unvernünftige Wirksamkeit von Quasirandom-Sequenzen , wie auf einfache Weise eine offene Sequenz mit geringer Diskrepanz in beliebigen Dimensionen erstellt werden kann, ist für die Diskretisierung viel zugänglicher als bestehende vorhandene Sequenzen mit geringer Diskrepanz, wie z die Halton- und Kronecker-Sequenzen.

Der Abschnitt im Beitrag "Covering" befasst sich speziell mit Ihrer Frage der Diskretisierung der Sequenzen mit geringer Diskrepanz.

In den folgenden Bildquadraten (die einen eindeutigen ganzzahligen Gitterpunkt anzeigen) mit weniger Rot bedeutet dies eine gleichmäßigere Verteilung, da jedes rote Quadrat anzeigt, dass die Zelle keinen blauen Punkt enthält. Man kann deutlich sehen, wie selbst die Sequenz Punkte im Vergleich zu anderen zeitgenössischen Methoden verteilt.R

Bild: Diskrete Sequenzen mit geringer Diskrepanz in zwei Dimensionen

Die Lösung ist eine additive Wiederholungsmethode (Modulo 1), die das eindimensionale Problem verallgemeinert, dessen Lösung vom Goldenen Schnitt abhängt. Die Lösung des dimensionalen Problems hängt von einer speziellen Konstante , wobei der Wert des kleinsten positiven reellen Werts von so dass ϕ d ϕ d x x d + 1dϕdϕdx

xd+1=x+1

Für ist  , was der kanonische goldene ist.φ 1 = 1,618033989 ...d=1ϕ1=1.618033989...

Für ist , was oft als plastische Konstante bezeichnet wird und einige schöne Eigenschaften hat. Es wurde vermutet, dass dieser Wert höchstwahrscheinlich der optimale Wert für ein verwandtes zweidimensionales Problem ist [Hensley, 2002].d=2ϕ2=1.3247179572...

Jacob Rus hat eine wunderschöne Visualisierung dieser zweidimensionalen Sequenz mit geringer Diskrepanz veröffentlicht, die hier zu finden ist .

Mit dieser speziellen Konstante ist die Berechnung des ten Terms jetzt extrem einfach und schnell zu berechnen:n

R:tn=αα0+nαα(mod1),n=1,2,3,...
whereαα=(1ϕd,1ϕd2,1ϕd3,...1ϕdd),

Der Grund, warum dies als Wiederholungssequenz bezeichnet wird, ist natürlich, dass die obige Definition

R:tn+1=tn+αα(mod1)

In fast allen Fällen die Wahl von nichts an den Schlüsselmerkmalen. Aus Gründen der offensichtlichen Einfachheit ist die übliche Wahl. Es gibt jedoch einige Argumente in Bezug auf Symmetrie, die darauf hindeuten, dass eine bessere Wahl ist.ααα0ααα0=00αα0=1/21/2

Der Python-Code lautet

# Use Newton-Rhapson-Method
def gamma(d):
    x=1.0000
    for i in range(20):
        x = x-(pow(x,d+1)-x-1)/((d+1)*pow(x,d)-1)
    return x

d=5
n=1000

# m can be any number.
# In the diagram above it is chosen to be exactly sqrt of n, 
# simply to to make the visualization more intuitive 
# so that ideally each cell should have exactly one dot.
m=10

g = gamma(d)
alpha = np.zeros(d)                 
for j in range(d):
    alpha[j] = pow(1/g,j+1) %1
z = np.zeros((n, d))    
c = (np.zeros((n,d)).astype(int)  

for i in range(n):
    z = (0.5 + alpha*(i+1)) %1
    c = (np.floor(m *z)).astype(int)
print(c)

Ich hoffe, das hilft!

Martin Roberts
quelle
2

Wenn Sie eine begrenzte Anzahl von Leerzeichen haben, ist es besser, wenn Sie eine explizite Aufzählung möglicher Leerzeichen mit einem ausgewogenen, unvollständigen Blockdesign darauf aufbauen. Am Ende sind die Eigenschaften der Sequenzen mit geringer Diskrepanz asymptotisch, wobei wünschenswerte Eigenschaften mit den Längen der Ordnung wobei die Dimension Ihres Raums ist. Wenn die Anzahl der möglichen Kombinationen geringer ist, können Sie einfach alle möglichen Kombinationen nehmen und damit ein ausgewogenes Design erzielen. sN6ss

Update: Es gab ein Buch , in dem die Verwendung von QMC für Poisson-Prozesse und Bernoulli-Versuche erörtert wurde. Vielleicht finden Sie dort etwas Nützliches, obwohl es meiner Meinung nach weit entfernt von einem guten Preis-Leistungs-Verhältnis ist. Für 15 Dollar vielleicht. Ich fand es stellenweise etwas schlampig, die (manchmal seltsamen) Ideen des Autors voranzutreiben, anstatt das zu verwenden, was in der Literatur als die besten Methoden verstanden wurde.

StasK
quelle
Schöne allgemeine Antwort, Stask, aber sie spricht nur die Annahmen hinter meiner Frage an und nicht direkt meine Frage. Vielen Dank, dass Sie auf BIDB hingewiesen haben, aber ich würde trotzdem gerne wissen, ob Sequenzen mit geringer Diskrepanz so funktionieren, wie ich es beschreibe (dies kann nur eine Frage der Klarstellung sein, was Sie unter "die Eigenschaften ... sind asymptotisch" verstehen).
naught101
Eine separate Frage: Wie unterscheidet sich BIDB von orthogonalen lateinischen Hyperwürfeln? Scheint im Grunde das Gleiche zu sein (obwohl es vielleicht aus verschiedenen Blickwinkeln kommt). Was ist QMC?
naught101