Verteilen einer binären Beziehung in Bins, sodass sich jedes Element in einer kleinen Anzahl von Bins befindet

10

Wir erhalten Objektpaare (z. B. Zahlen). Jedes Objekt erscheint in höchstens q Paaren. Unser Ziel ist es, die Paare in gleich große Bins zu verteilen, sodass jedes Objekt in möglichst wenigen unterschiedlichen Bins vorkommt.

Genauer gesagt interessiert uns eine Funktion f mit der Eigenschaft, dass für jede binäre Beziehung mit m Paaren mit höchstens q Paaren pro Objekt eine Verteilung der Paare auf p Bins vorliegt, so dass jeder Bin m/p Paare empfängt ( p sollte m ) teilen , und kein Objekt tritt in mehr als f(m,q,p) Behältern auf.

Diese Frage tauchte in unserer Untersuchung zur parallelen Abfrageauswertung auf. Man würde erwarten, dass m im Vergleich zu groß ist p. Die "richtige" Größe von q ist weniger klar. Eine interessante Größe für q könnte z. B. mp . Eine Funktion, die nicht vonabhängtq, sondern nur für einen bestimmten Bereich vonfunktioniert,qwäre ebenfalls nützlich (aber nichtq=O(1)).

Eigentlich sind wir nach Grenzen der Form p1ϵ , mit ϵ>0 so groß wie möglich ...

Thomas S.
quelle
3
In der Graphenterminologie: Wenn eine ganze Zahl und ein Graph G = ( V , E ) mit m Kanten gegeben sind, wobei jeder Scheitelpunkt höchstens q hat , finden Sie p Untergraphen G 1 , G 2 , , G p, wobei G i = ( V. i , E i ) , so dass V = i V i und { E i } ipG=(V,E)mqpG1,G2,,GpGi=(Vi,Ei)V=iVi{Ei}iEpm/pvVkk k m p q(maxv|{i:vVi}|k)kkmpq
Das stimmt. In Bezug auf Grafiken. Die Antwort auf die Frage lautet: . In der Tat sind wir, wie oben geschrieben, an Grenzen der Form interessiert und haben keine solche Bindung für . p 1 - ϵ ϵ > 0pp1ϵϵ>0
Thomas S
Ein Sonderfall für den Einstieg: Sei eine ungerade ganze Zahl. Kann man die Kanten des vollständigen Graphen in Teilmengen der Größe so dass für jeden Scheitelpunkt die Anzahl der Teilmengen, die Kanten enthalten, die auf diesen Scheitelpunkt fallen, , für einige ? Ich wette ja für jedes --- nimm jeweils zufällige Vertex-Teilmengen der Größe . Dann befindet sich mit hoher Wahrscheinlichkeit jeder Scheitelpunkt in ungefähr der Scheitelpunktteilmengen, und jedes Paar befindet sich in ungefährn1(n2)Knn(n1)/2O(n1ϵ)ϵ>0ϵ<1/2nn1ϵn1ϵ(i,j)n12ϵ der Teilmengen. Ordnen Sie nun die Paare Teilmengen zu ...
Neal Young
In diesem Fall können die Knoten zuerst in Mengen der Größe (denken Sie an Intervalle). Dann erhält jeder Behälter das Produkt von zwei solchen Sätzen (ich betrachte den vollständigen gerichteten Graphen, der leichter zu formulieren und asymptotisch nicht viel anders ist). Daher tritt jeder Scheitelpunkt in Bins auf, in diesem Fall . nnI×Jnϵ=12
Thomas S
Für den Sterngraphen ( Kanten, die auf einen Scheitelpunkt ) muss sich der Scheitelpunkt in jedem der Teilgraphen befinden, daher ist in diesem Fall eine Grenze von weniger als nicht möglich. Ich denke, deshalb beschränken Sie den maximalen Grad ? Vielleicht könnten Sie etwas Bestimmtes dazu sagen, da dies eine entscheidende Annahme zu sein scheint. In der Zwischenzeit habe ich eine Beobachtung (keine Antwort, aber zu groß, um als Kommentar zu passen!) Als Antwort unten hinterlassen. n1rrppq
Neal Young

Antworten:

1

Dies ist keine Antwort. Es ist nur die etwas triviale Beobachtung, dass Sie mit WLOG die Anforderung lockern können, dass es genau Randteilmengen mit genau derselben Größe gibt, und stattdessen einfach nach einer beliebigen Anzahl von Randteilmengen der Größe suchen . Vielleicht hilft dies, über das Problem nachzudenken.p{Ei}iO(the desired size)

Fixiere jeden Graphen und eine ganze Zahl . SeiG=(V,E)p1s=|E|/p

Lemma. Angenommen , es gibt Subgraphen , so dass Partitionen in ( eine beliebige Anzahl von) Teile der Größe . Sei ist die maximale Anzahl von Teilen, in denen sich ein Scheitelpunkt befindet.{Gj=(Vj,Ej)}j{Ej}jEO(s)

M=maxvV|{j:vVj}|

Dann gibt es Subgraphen , so dass partitioniert in genau Teile jeder Größe höchstens und p{Gi=(Vi,Ei)}i{Ei}iEps=|E|/p

maxvV|{i:vVi}|=O(M).

Beweis. Beginnen Sie mit der Folge und ersetzen Sie jeden Teil in der Folge durch eine beliebige geordnete Folge der in diesem Teil enthaltenen Kanten. Sei die resultierende Folge (eine Permutation von so dass jeder Teil ein "Intervall" von Kanten in ist die Sequenz). Teilen Sie nun diese Sequenz in zusammenhängende Teilsequenzen auf, so dass jede außer der letzten die Größe , und lassen Sie die Kanten in der ten zusammenhängenden enthalten . (DamitE1,E2,,EpEje1,e2,,emEEj{ea,ea+1,,eb}psEiiEi={eis+1,eis+1,,e(i+1)s} für .)i<p

Unter der Annahme, dass jeder Teil die Größe , und durch das Design hat jeder Teil Ausnahme des letzten Teils die Größe , so dass (aufgrund der Art und Weise, wie definiert ist) die Kanten in einem bestimmten Teil sind in auf Teile aufgeteilt . Dies und die Annahme, dass jeder Scheitelpunkt in höchstens der Teile in auftritt, implizieren, dass jeder Scheitelpunkt in höchstens der Teile in auftritt . QEDEjO(s)EjEps{Ei}iEjO(1){Ei}iM{Ej}jO(M){Ei}i

Neal Young
quelle