Man betrachte einen endlichen Satz über Elementen und ein unbekanntes monotones Prädikat über (dh für jedes , , wenn und dann ). . Ich kann auswerten, indem ich einen Knoten bereitstelle und herausfinde, ob P ( x ) gilt oder nicht. Mein Ziel ist es, die Menge der Knoten x ∈ X so genau zu bestimmen, dass P ( x ) gilt, wobei nur wenige Bewertungen von P verwendet werdenwie möglich. (Ich kann meine Abfragen in Abhängigkeit von der Antwort auf alle vorherigen Abfragen auswählen. Ich muss nicht alle Abfragen im Voraus planen.)
Meine Frage ist folgende: Als Eingabe das Poset , wie kann ich die schlechteste Laufzeit der optimalen Strategien bestimmen?
[Es ist klar, dass für ein leeres Poset Abfragen erforderlich sind (wir müssen nach jedem einzelnen Knoten fragen) und dass für eine Gesamtreihenfolge um Abfragen erforderlich sind (eine binäre Suche durchführen, um zu finden) Der Frontmann). Ein allgemeineres Ergebnis ist die folgende informationstheoretische Untergrenze: Die Anzahl der möglichen Auswahlen für das Prädikat ist die Anzahl der Antiketten von (da es eine Eins-zu-Eins-Zuordnung zwischen monotonen Prädikaten und gibt Antichains werden als die maximalen Elemente von ) interpretiert. Da also jede Abfrage ein Bit Information liefert, benötigen wir mindestensAbfragen, wobei die beiden vorherigen Fälle zusammengefasst werden. Ist dies eng gebunden, oder handelt es sich um einige Posets, deren Struktur derart ist, dass für das Lernen asymptotisch mehr Abfragen erforderlich sind als die Anzahl der Antichains?]
Antworten:
Dies ist keine vollständige Antwort, aber es ist zu lang, um einen Kommentar abzugeben.
Ich glaube, ich habe ein Beispiel gefunden, für das die Schranke nicht eng ist.⌈log2NX⌉
Betrachten Sie den folgenden Poset. Die Grundmenge ist und a i kleiner als b j für alle i , j ∈ { 1 , 2 } . Die anderen Paare sind unvergleichlich. (Das Hasse-Diagramm ist ein 4- Zyklus).X={a1,a2,b1,b2} ai bj i,j∈{1,2} 4
Lassen Sie mich die monotonen Eigenschaften mit den Störungen des Posets identifizieren. Dieses Poset hat sieben Verstimmungen: , { b 1 } , { b 2 } , { b 1 , b 2 } , { a 1 , b 1 , b 2 } , { a 2 , b 1 , b 2 } , { a 1 , a 2 , b 1 ,∅ {b1} {b2} {b1,b2} {a1,b1,b2} {a2,b1,b2} , und dieses Poset hat sieben Gegenketten, da die Gegenketten mit den Verstimmungen eins zu eins korrespondieren. Also ist 2 log 2 N X ⌉ = ⌈ log 2 7 ⌉ = 3 für diesen Poset.{a1,a2,b1,b2} ⌈log2NX⌉=⌈log27⌉=3
Nun zeige ich durch gegnerische Argumentation, dass jede Strategie mindestens vier Abfragen benötigt (also alle Elemente abfragen muss). Lassen Sie uns eine beliebige Strategie festlegen.
Wenn die Strategie zuerst abfragt , antwortet der Gegner " P ( eine 1 ) ist nicht gültig". Dann haben wir fünf Möglichkeiten: ∅ , { b 1 } , { b 2 } , { b 1 , b 2 } , { a 2 , b 1 , b 2 } . Um festzustellen, was der Fall ist, benötigen wir also mindestens least log 2 5 ⌉ = 3a1 P(a1) ∅ {b1} {b2} {b1,b2} {a2,b1,b2} ⌈log25⌉=3 mehr Anfragen. Insgesamt benötigen wir vier Abfragen. Dasselbe Argument gilt, wenn die erste Abfrage .a2
Wenn die Strategie zuerst abfragt , antwortet der Gegner mit " P ( b 1 ) gilt". Dann haben wir fünf Möglichkeiten: { b 1 } , { b 1 , b 2 } , { a 1 , b 1 , b 2 } , { a 2 , b 1 , b 2 } , { a 1 , a 2 , bb1 P(b1) {b1} {b1,b2} {a1,b1,b2} {a2,b1,b2} . Aus diesem Grund benötigen wir nach wie vor mindestens drei weitere Abfragen. Insgesamt benötigen wir vier Abfragen. Das gleiche Argument gilt, wenn die erste Abfrage b 2 ist .{a1,a2,b1,b2} b2
Wenn wir parallele Kopien dieses Posets nehmen, dann hat es 7 k Antichains, und daher ist die vorgeschlagene Grenze ⌈ log 2 7 k ⌉ = 3 k . Da jedoch jede Kopie vier Abfragen benötigt, benötigen wir mindestens 4 k Abfragen.k 7k ⌈log27k⌉=3k 4k
Wahrscheinlich gibt es einen größeren Poset mit größerer Lücke. Dieses Argument kann jedoch nur den Koeffizienten verbessern.
Hier scheint das Problem eine Situation zu sein, in der keine Abfrage den Suchraum gleichmäßig aufteilt. In einem solchen Fall kann der Gegner die größere Hälfte zum Bleiben zwingen.
quelle
In ihrer Arbeit Jedes Poset hat ein zentrales Element , Linial und Saks zeigen (Satz 1), dass die Anzahl der Abfragen, die zur Lösung des idealen Identifikationsproblems in einem Poset erforderlich sind, höchstens K 0 log 2 i ( X ) beträgt , wobei K 0 = 1 / ( 2 - log 2 ( 1 + log 2 5 ) ) und I ( X ) ist die Anzahl der Ideale von X . Was sie ein "Ideal" nennen, ist eigentlich eine niedrigere MengeX K0log2i(X) K0=1/(2−log2(1+log25)) i(X) X und es gibt eine offensichtliche Eins-zu-eins-Entsprechung zwischen monotonen Prädikaten und der unteren Menge der Punkte, an denen sie nicht festhalten, abgesehen von ihrem "Identifikationsproblem", dass sie durch Abfragen von Knoten identifiziert werden, genau wie in meiner Einstellung, also denke ich, dass dies der Fall ist Umgang mit dem Problem in ich interessiert bin und dass .i(X)=NX
Entsprechend ihrem Ergebnis ist die informationstheoretische Untergrenze bis zu einer relativ kleinen multiplikativen Konstante eng. Also im Grunde dies die Frage nach der Anzahl der Fragen erforderlich gelegt hat , als eine Funktion von und bis zu einer multiplikativen Konstante: Es ist zwischen log 2 N X und K 0 log 2 N X .NX log2NX K0log2NX
Linial und Saks zitieren eine persönliche Mitteilung von Shearer, um zu sagen, dass es bekannte Ordnungen gibt, für die wir eine Untergrenze von für einige K 1 nachweisen können, die nur geringfügig kleiner als K 0 ist (dies ist im Sinne von Die Antwort von Yoshio Okamoto, der diesen Ansatz für einen kleineren Wert von K 1 ) ausprobierte .K1log2NX K1 K0 K1
Damit ist meine Frage nach der Berechnung der Anzahl der von benötigten Fragen nicht vollständig beantwortet. Da jedoch die Berechnung von N X von X # P-vollständig ist , habe ich das Gefühl, dass es wenig Hoffnung gibt. (Kommentare zu diesem Punkt sind willkommen.) Dennoch ist dieses Ergebnis von Linial und Saks aufschlussreich.X NX X
quelle
Für den booleschen n-Würfel (oder äquivalent für den Satz ( 2 S , ⊆ ) aller Teilmengen einer n-Elementmenge) wird die Antwort von Korobkov und Hänsel gegeben (ab 1963 bzw. 1966). Der Satz von Hansel [1] besagt, dass eine unbekannte monotone Boolesche Funktion (dh ein unbekanntes monotones Prädikat für diesen Poset) durch einen deterministischen Algorithmus gelernt werden kann, der höchstens ϕ ( n ) = ( n ) ergibt({0,1}n,≤) (2S,⊆) Abfragen (das heißt,fragenφ(n)Fragen im schlimmsten Fall). Dieser Algorithmus entspricht der Untergrenze von Korobkovs Theorem [2], wonachϕ(n)-1-Abfragen nicht ausreichen. (Hansels Algorithmus ist also im ungünstigsten Fall optimal.) Ein Algorithmus in beiden Anweisungen wird als deterministischer Entscheidungsbaum verstanden.ϕ(n)=(n⌊n/2⌋)+(n⌊n/2⌋+1) ϕ(n) ϕ(n)−1
Der Logarithmus der Anzahl der Antichains in ist asymptotisch gleich ( n({0,1}n,≤) , so gibt es eine konstante Faktorlücke zwischenlogNXund der optimalen Algorithmusleistungϕ(n)∼2 ( n(n⌊n/2⌋)∼2n/πn/2−−−−√ logNX für diesen Poset.ϕ(n)∼2(n⌊n/2⌋)
Leider war es mir nicht möglich, eine gute Behandlung von Hansels Algorithmus in englischer Sprache im Internet zu finden. Es basiert auf einem Lemma, das den n-Würfel in -Ketten mit speziellen Eigenschaften unterteilt. Eine Beschreibung findet sich in [3]. Für die untere Grenze kenne ich keinen Verweis auf eine Beschreibung in Englisch.ϕ(n)
Da ich mit diesen Ergebnissen vertraut bin, kann ich eine Beschreibung auf arXiv posten, falls die Behandlung in Kovalerchuks Artikel nicht ausreicht.
Wenn nicht viel falsch ist, hat es Versuche gegeben, Hansels Ansatz zu verallgemeinern, zumindest auf das Poset , wobei ( E k , ≤ ) eine Kette 0 < 1 < … < k - 1 ist , obwohl ich kann nicht sofort einen Hinweis geben. Für den Booleschen Fall haben die Menschen auch andere Komplexitätsbegriffe als den Worst-Case für dieses Problem untersucht.(Enk,≤) (Ek,≤) 0<1<…<k−1
[1] G. Hansel, Sur le nombre des fonctions booléennes monotones de n variables. CR Acad. Sci. Paris, 262 (20), 1088-1090 (1966)
[2] VK Korobkov. Abschätzung der Anzahl der monotonen Funktionen der Algebra der Logik und der Komplexität des Algorithmus zum Auffinden des Resolventensatzes für eine beliebige monotone Funktion der Algebra der Logik. Sowjetische Mathematik. Doklady 4, 753-756 (1963) (Übersetzung aus dem Russischen)
[3] B. Kovalerchuk, E. Triantaphyllou, AS Deshpande, E. Vityaev. Interaktives Lernen von monotonen Booleschen Funktionen. Information Sciences 94 (1), 87-118 (1996) ( Link )
quelle
[ HINWEIS: Das folgende Argument scheint nicht zu funktionieren, aber ich lasse es hier, damit andere nicht denselben Fehler machen / falls jemand es beheben kann. Das Problem ist, dass eine exponentielle Untergrenze für das Lernen / Identifizieren einer monotonen Funktion, wie unten gezeigt, einem inkrementell polynomiellen Algorithmus für das Problem nicht unbedingt widerspricht . Und das letztere ist äquivalent zur Überprüfung der gegenseitigen Dualität zweier monotoner Funktionen in Polyzeit.]
Ich glaube, Ihre Vermutung in ist im Allgemeinen falsch. Wenn es tatsächlich der Fall ist, dass log N X Abfragen benötigt werden, impliziert dies eine ziemlich starke Untergrenze für das Erlernen von monotonen Funktionen unter Verwendung von Mitgliedschaftsabfragen . Insbesondere läßt die poset X der Boolesche Würfel mit der üblichen Ordnung sein (wenn man so will, X ist die Potenz von { 1 , . . . , N } mit ⊆ als Teilauftrag). Die Anzahl M der maximalen Antiketten in X erfüllt log M =logNX logNX X X {1,...,n} ⊆ M X [1]. Wenn Ihre Idee inlogNXkorrekt ist, gibt es ein monotonisches Prädikat inX, das im Wesentlichen ( n-1)erfordertlogM=(1+o(1))(n−1⌊n/2⌋) logNX X Abfragen. Insbesondere impliziert dies eine Untergrenze von im Wesentlichen2nfür die Komplexität jedes Algorithmus, der dieses Problem löst.(n−1n/2)≈2n 2n
Wenn ich es jedoch richtig verstanden habe (von dem ich jetzt weiß, dass ich es nicht verstanden habe ), ist Ihr Problem gleichbedeutend damit, die gegenseitige Dualität von zwei monotonen Funktionen zu überprüfen, was in quasi-polynomialer Zeit geschehen kann (siehe das Intro dieses Artikels von Bioch und Ibaraki , die Fredman und Khachiyan zitieren , widersprechen allem, was nahe an einer Untergrenze liegt.2n
[1] Liviu Ilinca und Jeff Kahn. Zählung maximaler Antichains und unabhängiger Mengen . arXiv: 1202,4427
quelle