Verallgemeinern des „Median-Tricks“ auf höhere Dimensionen?

21

Für randomisierte Algorithmen die reelle Werte annehmen, ist der "Median-Trick" eine einfache Methode, um die Wahrscheinlichkeit eines Ausfalls auf einen Schwellenwert zu reduzieren , und zwar nur auf Kosten eines multiplikativen Gemeinkosten. Wenn nämlich die Ausgabe von mit einer Wahrscheinlichkeit von (mindestens) in einen "guten Bereich" fällt, werden unabhängige Kopien und unter Berücksichtigung des Medians ihrer Ausgaben ergibt sich ein Wert, der mit einer Wahrscheinlichkeit von mindestens nach Chernoff / Hoeffding-Schranken in fällt . δ > 0 t = O ( log 1Aδ>0AI=[a,b]2/3A1,...,Ateinen1,...,atI1-δt=O(log1δ)AI=[a,b]2/3A1,,Ata1,,atI1δ

Gibt es eine Verallgemeinerung dieses "Tricks" zu höheren Dimensionen, sagen wir , wo der gute Bereich jetzt eine konvexe Menge (oder eine Kugel oder eine ausreichend schöne und strukturierte Menge) ist? Das heißt, ein randomisierter Algorithmus Werte in und eine "gute Menge" so dass für alle , wie kann man die Erfolgswahrscheinlichkeit mit nur logarithmischen Kosten in auf erhöhen ?A R d S R d P r { A (x,r)S}2 / 3x1-δ1 / δRdARdSRdPr{A(x,r)S}2/3x1δ1/δ

(Anders ausgedrückt: Bei gegebenem festen, willkürlichen mit der Garantie, dass mindestens der zu gehören , gibt es eine Prozedur einen Wert ausgeben von ? Wenn ja, gibt es einen effizienten?)2 ta1,,atRd aiSS2t3aiSS

Und was ist der minimale Satz von Annahmen, den man für braucht, um das oben Genannte zu erreichen?S

Entschuldigung, wenn sich herausstellt, dass dies trivial ist - ich konnte zu dieser Frage keine Referenz finden ...

Clement C.
quelle
3
Funktioniert es in dem speziellen Fall, dass ein Quader ist, wenn Sie den Median-Trick in jeder Dimension einzeln verwenden? Probieren Sie also eine Reihe von Punkten aus, und nehmen Sie den Median ihrer Koordinaten in Dimension 1, 2, ..., d. Dann erhalten Sie einen Punkt in . Vielleicht benötigen Sie für diese Strategie Beispiele? R d O ( log ( d / ϵ ) )SRdO(log(d/ϵ))
Robin Kothari
1
Im eindimensionalen Fall kennen Sie normalerweise aber nicht das genaue Intervall (obwohl der Median-Trick auch dann noch funktioniert, wenn Sie nicht kennen ). Sollen wir davon ausgehen, dass wir kennen, aber nur bis zur Übersetzung? Bis zur Übersetzung und Skalierung? b - a SbabaS
Sasho Nikolov
@SashoNikolov Ich gehe davon aus, dass dies tatsächlich die "allgemeinste Verallgemeinerung" ist (z. B. wissen wir nur, dass eine "gute Kugel mit dem Durchmesser ε " ist). Sε
Clement C.
1
Nun, was Thomas in seiner Antwort schrieb, ist noch allgemeiner: Er geht davon aus, dass ( G in seiner Antwort) eine unbekannte konvexe Menge ist. SG
Sasho Nikolov

Antworten:

17

Was Sie suchen, ist fast dieselbe robuste zentrale Tendenz : eine Möglichkeit, eine Datenpunktwolke auf einen einzigen Punkt zu reduzieren, sodass viele der Datenpunkte einer "Grundwahrheit" nahe kommen, der Rest jedoch beliebig weit weg sind, dann wird dein Output auch nahe an der Bodenwahrheit liegen. Die "Durchbruchstelle" einer solchen Methode ist der Anteil willkürlich schlechter Ausreißer, den sie tolerieren kann. Der Unterschied besteht darin, dass Sie in Ihrem Fall "in der Nähe von" durch "in der konvexen Hülle von" ersetzen möchten.

Eine Möglichkeit, dies einzufangen, ist der Begriff der Tukey-Tiefe. Ein Punkt hat die Tukey-Tiefe (in Bezug auf eine gegebene Menge von n Datenpunkten), wenn jeder Halbraum, der den gegebenen Punkt enthält, auch mindestens p n Datenpunkte enthält . Wenn es einen guten konvexen Unterraum gibt, in dem Sie sich befinden möchten, befindet sich ein Punkt mit der Tukey-Tiefe p darin, solange sich mindestens ( 1 - p ) n der Datenpunkte darin befinden. Der Durchschlagspunkt dieser Methode ist also der größte Wert von p , den Sie erreichen können.pnpnp(1p)np

Leider ist dieser Aufschlüsselungspunkt , nicht nahe 1/2, sowohl für die Tukey-Tiefe als auch für Ihr Problem. Hier ist der Grund: Wenn Ihre Daten in der Nähe der d + 1- Eckpunkte eines Simplex gruppiert sind , sind so lange weniger als 1 / ( d + 1 ) Bruchteil davon Ausreißer (aber Sie wissen nicht, welche), irgendwo in Der Simplex kann sicher ausgewählt werden, da er sich immer innerhalb der konvexen Hülle der Nicht-Ausreißer befindet. Aber wenn mehr als 1 / ( d + 1 )1/(d+1)d+11/(d+1)1/(d+1) Bei den Punkten kann es sich um Ausreißer handeln, es gibt jedoch keinen Ort, der sicher ausgewählt werden kann: Unabhängig davon, welchen Punkt im Simplex Sie auswählen, können die Ausreißer alle Punkte des nächsten Simplex-Scheitelpunkts sein, und Sie befinden sich außerhalb des Rumpfs des Nicht-Simplex-Scheitelpunkts. Ausreißer.

Wenn Sie einen schlechteren Durchschlag tolerieren wollen, eher wie , gibt es eine zufällige Methode, um einen tiefen Punkt zu finden, der sowohl in n als auch in d polynomisch ist : siehe meine ArbeitO(1/d2)nd

Approximation von Mittelpunkten mit iterierten Radonpunkten, K. Clarkson, D. Eppstein, GL Miller, C. Sturtivant und S.-H. Teng, 9. ACM Symp. Comp. Geom. , San Diego, 1993, S. 91–98, Int. J. Comp. Geom. & Appl. 6 (3): 357–377, 1996, http://kenclarkson.org/center/p.pdf

David Eppstein
quelle
Ja. Darüber hinaus möchte ich erwähnen, dass man eps-Netze und ihre verschiedenen Freunde verwenden kann, um eine kleine Stichprobe zu erhalten, die solche Tiefenmaße gut approximiert. Sie bekommen nicht einen einzigen Punkt, aber Sie bekommen viel mehr Informationen.
Sariel Har-Peled
Gibt es in Bezug auf die Terminologie Ihres Papiers eine bekannte effiziente Möglichkeit, a beansprucht Zentrum für rationale Zahlen βββ?
Wenn Sie mit "effizient" ein Polynom in der Dimension meinen, dann kenne ich ein solches Ergebnis nicht. Mein Aufsatz findet nur einen Punkt, es gibt keine weiteren Informationen über die räumliche Verteilung der Tiefe (wie Sariel oben anspielt).
David Eppstein
Vielen Dank! Abgesehen von Überlegungen zur Effizienz scheint dies zu sagen, dass es für den allgemeinen Fall von willkürlichen konvexen Mengen keine Möglichkeit gibt, die konstante Wahrscheinlichkeit auf eine willkürliche Wahrscheinlichkeit zu erhöhen. (da der Anteil der guten Punkte größer als ? (Oder habe ich etwas verpasst? Wenn ich zurückblicke, fühlt es sich so an, als würde die zweite Formulierung, die ich erstellt habe, nicht die Idee von "unabhängigen Wiederholungen" aufgreifen, bei denen wirmehrereSätze von Punktenin der Hand hätten, von denen jeder mindestens eine hat ein2/3-Bruchteil von guten Punkten.)11d+12/3
Clement C.
1
Ein Punkt, mehrere Punkte oder nicht, wenn Sie nur wissen, dass es eine konvexe Menge gibt, aber nicht dort, wo sie ist, und Sie möchten die Wahrscheinlichkeit, in der richtigen Menge zu sein, auf besser als d / (d + steigern können 1), dann muss der Anteil der guten Punkte mindestens d / (d + 1) betragen, um das Simplex-Beispiel zu umgehen. Andernfalls könnte ein Gegner Ihnen Daten in Form eines Simplexes geben und zufällig eine Epsilon-Nachbarschaft einer Seite des Simplexes als konvexe Menge auswählen. Selbst wenn Sie zufällig einen Punkt in der Nähe eines Scheitelpunkts des Simplex erraten, besteht eine Wahrscheinlichkeit von mindestens 1 / (d + 1), dass Sie eine falsche Auswahl treffen.
David Eppstein
14

Dies ist eine nette Frage, über die ich schon einmal nachgedacht habe. Folgendes haben wir uns ausgedacht:

Sie führen Ihren Algorithmus mal aus, um die Ausgaben x 1 , , x nR d zu erhalten, und Sie wissen, was mit hoher Wahrscheinlichkeit ein großer Bruchteil von x i s in eine gute Menge G fällt . Sie wissen nicht, was G ist, nur dass es konvex ist. Die gute Nachricht ist, dass es eine Möglichkeit gibt, einen Punkt in G zu bekommen, ohne weitere Informationen darüber. Nenne diesen Punkt f ( x 1 , , x n ) .nx1,,xnRdxiGGGf(x1,,xn)

Satz. Für alle natürlichen Zahlen und D gibt es eine Funktion f : ( R d ) nR d , so daß folgendes gilt. Sei x 1 . . . x nR d und lassen G R d eine konvexe Menge befriedigend sein 1ndf:(Rd)nRdx1...xnRdGRdDannf(x1,...,Xn)G. Zudemfist inZeitPolynom in berechenbarnd.
1n|{i[n]:xiG}|>dd+1.
f(x1,...,xn)Gfnd

Beachten Sie, dass wir für f als Median festlegen können . Dies zeigt also, wie der Median für d > 1 verallgemeinert wird .d=1fd>1

Bevor Sie dieses Ergebnis beweisen, stellen Sie fest, dass es eng ist: Sei und sei x 1 , , x d das Standardbasiselement und x d + 1 = 0 . Jede Teilmenge von d der Punkte ist in einem affinen Raum G der Dimension d - 1 enthalten (der durch diese Punkte eindeutig definiert ist). Aber in all diesen affinen Räumen ist kein Punkt enthalten. Daher gibt es ein konvexes G , das n d / ( d + enthältn=d+1x1,,xdxd+1=0dGd1G Punkte, enthält aber kein f ( x 1 , , x n ) , welcher Wert auch immer angenommen wird.nd/(d+1)=df(x1,,xn)

Beweis. Wir verwenden das folgende Ergebnis.

Der Satz von Helly. Sei konvexe Teilmengen von R d sein . Angenommen, der Schnittpunkt von d + 1 K i s ist nicht leer. Dann ist der Schnittpunkt aller K i s nicht leer.K1...KmRdd+1 KiKi

Klicken Sie hier, um einen Beweis für Hellys Theorem zu erhalten.

Nun, um unseren Satz zu beweisen:

k<n/(d+1)GK1...KmRdnkKid+1

Kikd+1 Kink(d+1)KisfKi

KiG

GG

GGGnkGKiKiG

fKiKi

f

fnd

x1,,xnB(y,ε)zB(y,3ε)ndz=xiiB(z,2ε)

Thomas unterstützt Monica
quelle
Ich denke, Sie haben die Tukey-Tiefe im Grunde genommen neu erfunden, wie David Eppstein unten skizziert.
Suresh Venkat
7

Es gibt einen Begriff des Medians einer Menge von Punkten in hohen Dimensionen und allgemeinen Normen, der unter verschiedenen Namen bekannt ist. Es ist nur der Punkt, der die Summe der Abstände zu allen Punkten in der Menge minimiert. Es ist bekannt, dass es eine ähnliche Konfidenzverstärkungseigenschaft wie der übliche Median mit einer kleinen multiplikativen Zunahme des Abstands aufweist. Sie finden die Details in Satz 3.1 dieses Papiers: http://arxiv.org/pdf/1308.1334.pdf

Eine schöne Sache, die dieser Aufsatz zeigt, ist, dass der Faktor, um den der Abstand zunimmt, zu jeder Konstante> 1 gemacht werden kann, wenn Sie von einem willkürlich hohen (aber konstanten <1) Vertrauen verstärken können.

Edit: es gibt eine andere kürzlich erschienene Arbeit über das Thema von Hsu und Sabato http://arxiv.org/pdf/1307.1827v6.pdf Es analysiert meist und wendet das Verfahren , bei dem der Punkt im Satz mit dem kleinsten mittleren Abstand zum Rest der Punkte wird verwendet. Dieses Verfahren kann mit jeder Metrik angewendet werden, liefert jedoch nur einen Näherungsfaktor von 3.

Vitaly
quelle
Sp
1
Nicht wirklich. Das Ergebnis wird für alle Banach-Räume angegeben. Für jeden Körper, der ursprünglich zentriert und um sein Zentrum symmetrisch ist, gibt es eine entsprechende Norm, in der dieser Körper die Einheitskugel ist. Da wir für Ihre Fragestellung ohne Einschränkung der Allgemeinheit davon ausgehen können, dass der konvexe Körper herkunftszentriert ist, erhalten wir die Ergebnisgrenzen für jeden zentral symmetrischen konvexen Körper. Vielleicht kann das Ergebnis mit ein wenig Mühe auf allgemeine konvexe Körper ausgedehnt werden.
Vitaly
1
Sie müssen die Norm kennen, um den Minimierer für diese Norm zu berechnen. Wenn Sie nur wissen, dass es eine Norm gibt, aber nicht, was sie ist, haben Sie Pech.
David Eppstein
1
Du hast recht, David. Sie müssen die Norm kennen. (Dies bedeutet, den konvexen Körper bis in die Mitte zu kennen und zu skalieren).
Vitaly
X0.9(1,0)(+1,0)0.1(0,0.0001)(1,0)(1,0)(0,0.0001)