Was ist über das folgende Problem bekannt?
Wenn eine Sammlung von Funktionen f : { 0 , 1 } n → { 0 , 1 } gegeben ist , finde eine größte Untersammlung S ⊆ C unter der Bedingung, dass VC-Dimension ( S ) ≤ k für eine ganze Zahl k ist .
Gibt es Näherungsalgorithmen oder Härteergebnisse für dieses Problem?
Antworten:
Edit : Das ursprüngliche Problem ist - schwer zu approximieren, wenn k = 1 ist, wobei n istn1−ϵ k=1 n die Anzahl der Mengen bezeichnet.
Das Dual eines Hypergraphen wird erhalten, indem Scheitelpunkte mit Kanten ausgetauscht und Vorkommen beibehalten werden. Es ist einfacher, das Problem zu verstehen, wenn wir feststellen, dass ein Hypergraph die VC-Dimension 1 hat, wenn sein Dual kreuzfrei ist (für alle in A mindestens eines von P ∩ Q , P ∖ Q , Q ∖ P , ( P ∪ Q ) c ist leer).P,Q A P∩Q,P∖Q,Q∖P,(P∪Q)c
Durch die Dualität ist das ursprüngliche Problem (für ) äquivalent zu, wenn ein Hypergraph ( V , S ) gegeben ist , um eine maximale Größe U ⊆ V mit ( U , { S ∩ U ∣ S ∈ S } ) zu finden.k=1 (V,S) U⊆V (U,{S∩U∣S∈S}) Querfrei.
In der Tat ist dies (dual) Problem sehr schwer , auch wenn alle Sätze in haben Größe 2: dann ist es eine grafische Darstellung ist , und wir sind für eine max-size Vertex Größe , deren Untergraphen , die sich nicht alle zwei Randweg enthalten ( es ist nicht schwer zu erkennen, dass dies der einzige Weg ist, auf dem ein Kreuzungspaar entstehen kann, vorausgesetzt, der Graph hat mindestens 4 Eckpunkte. Diese Eigenschaft ist jedoch erblich und nichttrivial und daher können wir ein Ergebnis von Feige und Kogan verwenden , um die Härte zu zeigen.S
Ursprüngliche Antwort
Das doppelte Problem für (finde eine maximale Größe S, so dass die doppelte VC-Dimension von S höchstens 1 ist) ist innerhalb von n 1 - ϵ (in einer Familie mit Θ ( n ) Mengen) schwer zu approximieren .k=1 S S n1−ϵ Θ(n)
Der Grund dafür ist , dass die Dual - VC-Dimension einer Familie ist 1 genau dann , wenn folgendes gilt: für alle P , Q in A , mindestens eines von P ∩ Q , P ∖ Q , Q ∖ P , ( P ∪ Q ) c ist leer. (Dh VC-dim = 1 ist das Doppelte dessen, was oft als Kreuzungsfreiheit bezeichnet wird.)A P,Q A P∩Q,P∖Q,Q∖P,(P∪Q)c
Wir reduzieren von der unabhängigen Menge auf die Berechnung der kreuzungsfreien Unterfamilie mit maximaler Größe. Wenn ein Graph konstruiere einen Hypergraphen H = ( X , S ), wobei X = V ⊎ E ⊎ { 0 } für ein Dummy-Element 0 ist . Für jeden Vertex v von G addieren wir die folgende Menge T v zu S : { v } ∪ { e ∣ eG=(V,E) H=(X,S) X=V⊎E⊎{0} 0 v G Tv S
Aber für das ursprüngliche (ursprüngliche) Problem scheint ein wenig mehr Nachdenken erforderlich zu sein ... sieht interessant aus!
quelle
Einige relevante verwandte Arbeiten: Die Schätzung der VC-Dimension selbst (geschweige denn das Auffinden einer großen Subkollektion mit begrenzter VC-Dimension) in Ihrer Darstellung ist LOGNP-vollständig (LOGNP ist NP, beschränkt auf log n Bits Nichtdeterminismus). Es gibt auch einige verwandte Arbeiten zum Schätzen und Approximieren der VC-Dimension, wenn die Darstellung des Bereichsraums kompakter ist (siehe auch die Referenzen innerhalb).
quelle