Betrachten Sie das Problem der Schnittmenge: Alice und Bob erhalten jeweils eine Teilmenge von und möchten wissen, ob sich ihre Mengen überschneiden. Dies ist ein kanonisches Problem der Kommunikationskomplexität, und es ist bekannt, dass randomisierte Protokolle für dieses Problem -Kommunikationsbits erfordern ( siehe Übersicht hier ). In dem Fall, in dem die Mengen die Größe k für k \ ll n haben , ist bekannt, dass randomisierte Protokolle \ Theta (k) -Bits erfordern ( siehe hier ).
Betrachten Sie nun die Variante, in der Alice und Bob die Größe des Schnittpunkts ihrer Mengen wissen wollen . Die Berechnung der exakten Größe reduziert sich eindeutig auf das Standardproblem der Satzkreuzung, und dies gilt auch dann, wenn nur eine multiplikative Approximation der Größe berechnet werden soll . Was passiert jedoch, wenn sie eine additive Näherung der Größe des Schnittpunkts berechnen möchten ? Ist eine Unter- oder Obergrenze für dieses Problem bekannt?
Diese Frage interessiert mich besonders bei der Einstellung kleiner Mengen, dh bei dem Fall, dass die Mengen die Größe .
quelle
Antworten:
Ich werde zwei Obergrenzen geben. Lassen und die Sätze zu Alice und Bob jeweils gegeben sein, und setzt,,.B a = | A | b = | B | c = | A ∩A B a=|A| b=|B| c=|A∩B|
Erstens gibt es ein randomisiertes Protokoll, das bei und mit der Wahrscheinlichkeit eine Annäherung von bis zum additiven Fehler unter Verwendung von berechnet Kommunikationsbits und Zufallsbits.ϵ > 0 ≥ 1 - ϵ c d O ( ( min {d>0 ϵ>0 ≥1−ϵ c d O((min{O((min{a,b}d)2lognlogϵ−1) O((min{a,b}d)2logmin{a,b}logϵ−1)
Das Protokoll lautet wie folgt:
Wenn , beendet die Partei, die es sieht, das Protokoll und gibt als Schätzung aus. Andernfalls kommunizieren Alice und Bob und miteinander und bestimmen, welche kleiner ist. Ich werde unter wlog annehmen, dass .0 a b ad≥min{a,b} 0 a b a≤b
Alice zeichnet unabhängige, gleichmäßig zufällige Stichproben , und sendet sie an Bob.a i ∈ A it=log(2ϵ−1)a2/(2d2) ai∈A i<t
Bob schätzt als.c at|{i<t:ai∈B}|
Das Protokoll ist durch die Chernoff-Hoeffding-Grenzen korrekt: Wenn die Indikator-Zufallsvariable des Ereignisses , dann sind , , iid-Variablen mit dem Mittelwert . Somit ist und ähnlich für .a i ∈ B X i i < t p = c / a Pr [ a ¯ X ≤ c - d ] = Pr [ ¯ X ≤ p - dXi ai∈B Xi i<t p=c/a Pr[a ¯ X ≥c+d]
Nun, diese Grenzen sind etwas verschwenderisch, wenn : Es gibt auch variante Chernoff-Grenzen, die was es uns ermöglichen würde, mit der Anzahl der Abtastwerte auszukommen, die um einen Faktor von ungefähr kleiner sind . Das Problem ist, dass genau die Größe ist, die wir approximieren möchten, daher wissen wir es nicht im Voraus. Dies kann behoben werden, indem zunächst eine Schätzung des von .Pr [ ¯ X ≤c≪a tpp=c
Das verbesserte Protokoll berechnet also mit der Wahrscheinlichkeit eine additive Approximation von Verwendung von Kommunikationsbits und Zufallsbits, und es geht wie folgt vor (die Konstanten sind nicht optimiert):d c O (≥ 1 - ϵ d c O(O ( min { a , b }d( 1 + cd) logn logϵ- 1) O ( min { a , b }d( 1 + cd) logmin { a , b } logϵ- 1)
Das gleiche wie oben.
Alice zieht Zufallsstichproben aus und sendet sie an Bob.r = 10 ( logϵ- 1) a / d EIN
Bob zählt, wie viele dieser Proben zu gehören , und sendet diese Nummer ( ) an Alice.B. s
Wenn , wird das Protokoll mit Ausgang .a s / r ≤ d/ 2 0
Alice zieht Zufallsstichproben , und sendet sie an Bob.a i ∈ A.t = 10 s a / d einich∈ A. i < t
Bob schätzt als.c eint| {i<t: aich∈ B } |
Ohne in die Details, begrenzt der Chernoff oben zitierte implizieren , dass mit hohen Wahrscheinlichkeit des Wert von ist , in welchem Fall das Protokoll nicht die angegeben Kosten nicht überschreitet und es berechnet mit hohen Wahrscheinlichkeit eine gute Schätzung von durch eine andere Anwendung von Chernoff-Grenzen.Θ ( c / a ) cs / r Θ ( c / a ) c
quelle
[Emils Antwort ist eindeutig besser und einfacher, wenn Sie an dieser Art von Fehler interessiert sind, es sei denn, Sie benötigen aus irgendeinem Grund ein deterministisches Protokoll. Hoppla.]
Es gibt nichttriviale Protokolle, wenn Sie an additiven Näherungen vom Typ für kleine Konstanten interessiert sind .δ > 0± δn δ> 0
Hier ist zum Beispiel eines:
Wenn diese Art der Annäherung für Sie interessant ist, können Sie möglicherweise mehr Kilometer mit anderen Lemmas zur Regelmäßigkeit von Graphen erzielen, insbesondere mit Frieze-Kannan. Hier ist eine Umfrage.
quelle