Ressource / Buch für die jüngsten Fortschritte in der statistischen Lerntheorie

10

Ich bin mit der Theorie hinter VC-Dimension ziemlich vertraut, aber ich schaue jetzt auf die jüngsten (letzten 10 Jahre) Fortschritte in der statistischen Lerntheorie: (lokale) Rademacher-Durchschnittswerte, Massarts Finite-Klassen-Lemma, Deckungszahlen, Verkettung, Dudleys Theorem, Pseudodimension, Fat Shattering Dimension, Packungszahlen, Rademacher-Zusammensetzung und möglicherweise andere Ergebnisse / Werkzeuge, die mir nicht bekannt sind.

Gibt es eine Website, eine Umfrage, eine Artikelsammlung oder vor allem ein Buch zu diesen Themen?

Alternativ sehe ich mir Beispiele an, wie der Rademacher-Durchschnitt für einfache Klassen gebunden wird, genauso wie Menschen achsenausgerichtete Rechtecke verwenden, um zu zeigen, wie die VC-Dimension gebunden wird.

Danke im Voraus.

Matteo
quelle

Antworten:

7

Ich glaube, Sie würden die Klassifikationstheorie genießen : Ein Überblick über die jüngsten Fortschrittevon Boucheron, Bousquet und Lugosi. Insbesondere beginnt es mit dem Aufbau einer grundlegenden Generalisierungstheorie über Rademacher-Komplexitäten, führt einige nützliche Werkzeuge ein (wie das Kontraktionsprinzip, dessen Beweis Sie in Shai & Shais Notizen finden können, auf die in der Antwort von Ashwinkumar verwiesen wird, die aber (glaube ich?) Aus dem Wahrscheinlichkeitsbuch von Ledoux & Talagrand, das nicht kostenlos ist, und wendet diese auf Standardklassifizierungsmethoden an (Boosting- und Support-Vektor-Maschinen werden sowohl aufgrund ihrer Beliebtheit als auch, da sie über ERM trainiert werden, diskutiert). Dieser Text stammt aus dem Jahr 2005, enthält also auch einige der anderen, etwas neueren Themen, die Sie erwähnt haben, z. B. Local Rademacher Complexities, und es gibt sogar einen winzigen Stecker für die Verkettung. Während das Manuskript ziemlich kurz ist,

Einige der anderen Themen, die Sie erwähnen, sind alt genug, um in "Eine probabilistische Theorie der Mustererkennung" von Devroye, Györfi und Lugosi zu stehen (insbesondere hat sie mehr mit dem Packen zu tun als jeder andere Text, den ich kenne). Obwohl einige der neueren Themen, die Sie erwähnen, fehlen, ist dies ein Standardbuch, das jeder, den ich in der Lerntheorie getroffen habe, in seinen Regalen geführt hat. Versuchen Sie vielleicht, ein Inhaltsverzeichnis und einen Index für das Buch zu finden, und blättern Sie darin.

Einige der anderen Themen, die Sie erwähnen, habe ich in einem Buch nicht gründlich behandelt gesehen, aber sie sind in einer Reihe von Kursnotizen enthalten. Wenn Sie beispielsweise auf die Seite von Sham Kakade bei UPenn gehen , finden Sie Links zu zwei Kursen zur Lerntheorie (einer war bei TTI-C mit Ambuj Tewari), und Sie werden sehen, dass die Themenlinks mit einigen der von Ihnen besprochenen Dinge übereinstimmen und sind nicht in meinen Antworten oder anderswo erschienen. Es gibt viele gute Kurse an verschiedenen Schulen; Avrim Blum hat ausgezeichnete, äußerst lesbare Notizen für seinen Lerntheoriekurs (seine Analyse von Winnow ist die kürzeste, sauberste und intuitivste, die ich je gesehen habe!).

Einige davon sind jedoch möglicherweise etwas zu neu, und Sie müssen zum Quellmaterial gehen. Aber wenn Sie wirklich nur versuchen, eine Sammlung von Techniken in die Hand zu nehmen, werden die Umfrage oben und die Vorlesungen für ein paar lerntheoretische Klassen Ihnen viel helfen.

Sie klingen auch so, als würden Sie nach fortgeschrittenen Texten suchen, aber ich möchte auch zwei Einführungstexte einfügen, die den Leuten sehr gefallen. Eine davon ist "eine Einführung in die Theorie des rechnergestützten Lernens" von Kearns und (U.) Vazirani, die zwar alt ist (zum Beispiel wird das Boosten nur über die ursprüngliche Konstruktion von Robert Schapire präsentiert und der Schwerpunkt liegt eher auf PAC als auf agnostischem Lernen) gut präsentiert und hat eine gute Intuition. Persönlich habe ich meine Grundlagen in Einführung in die statistische Lerntheorie von denselben Autoren wie in der obigen Umfrage erhalten (aber in der Reihenfolge Bousquet, Boucheron, Lugosi?); Es hat eine schöne Darstellung und war das erste Mal, dass die Generalisierungstheorie wirklich anfing, für mich zu klicken.

Matus
quelle
5

Dies war ein kürzlich unterrichteter Kurs. http://www.cs.huji.ac.il/~shais/Handouts.pdf . Ich habe es nicht sorgfältig durchgelesen, aber Kapitel 7 enthält Material zu Rademacher-Komplexitäten. Ich hoffe es hilft.

Ashwinkumar BV
quelle
Vielen Dank, dass Sie @Ashwinkumar. Ich mag die Tatsache, dass einige dieser Notizen aus einem Buch stammen, das gerade geschrieben wird.
Matteo