Algebraische Geometrie für die Statistik

8

Ich habe von Anwendungen der algebraischen Geometrie in Statistik und maschinellem Lernen gehört. Ich wollte versuchen, etwas über diese Themen zu lernen. Ich weiß fast nichts über algebraische Geometrie, aber ich habe einen Hintergrund in Mathematik und ich kenne mich mit grundlegender Gruppentheorie, Ringfeldern und etwas kommutativer Algebra aus. Meine Fragen sind:

  1. Was sind die algebrischen geometrischen Konzepte, die ich lernen sollte und die mit Anwendungen in Stats / ML verbunden sind (ich nehme an, dass nur ein Teil dessen, was normalerweise in Kursen und Büchern zur algebraischen Geometrie gelehrt wird, nützlich ist).

  2. Können Sie jemandem mit meinem Hintergrund einige Bücher / Einführungsartikel empfehlen? Ich meine nicht Standardlehrbücher für AG, sondern etwas, das sich auf Konzepte konzentriert, die in Anwendungen verwendet werden.

sjm.majewski
quelle
3
Sie könnten mit M. Drton, B. Sturmfels und S. Sullivant, Vorlesungen über algebraische Statistik , Springer, 2009 beginnen.
Kardinal

Antworten:

11

Hier ist eine Liste der Standardreferenzen:

Hier ist eine Liste verwandter Referenzen, die sich nicht direkt mit algebraischen Statistiken befassen, obwohl sie Hintergrundinformationen zu der für das Thema verwendeten Methodik liefern:

Webseiten mit Kursen zum Thema Vergangenheit und Gegenwart:

Diese Listen sind mit ziemlicher Sicherheit keineswegs vollständig.

Chill2Macht
quelle
5

Geben Sie hier die Bildbeschreibung ein

Dieses Buch ist sicherlich einflussreich und legt die Grundlagen für die Verwendung der algebraischen Geometrie in der statistischen Lerntheorie. Viele weit verbreitete statistische Modelle und Lernmaschinen für die Informationswissenschaft haben einen singulären Parameterraum: Mischungsmodelle, neuronale Netze, HMMs, Bayes'sche Netze und stochastische kontextfreie Grammatiken sind wichtige Beispiele. Algebraische Geometrie und Singularitätstheorie liefern die notwendigen Werkzeuge, um solche nicht glatten Modelle zu untersuchen. Es werden vier Hauptformeln festgelegt:

  1. Die Log-Likelihood-Funktion kann unter Verwendung der Auflösung von Singularitäten eine gemeinsame Standardform erhalten, die sogar auf komplexere Modelle angewendet wird.

  2. Das asymptotische Verhalten der Grenzwahrscheinlichkeit oder des „Beweises“ wird auf der Grundlage der Zeta-Funktionstheorie abgeleitet.

  3. Es werden neue Methoden abgeleitet, um die Generalisierungsfehler in Bayes- und Gibbs-Schätzungen aus Trainingsfehlern abzuschätzen.

  4. Die Generalisierungsfehler der Maximum-Likelihood- und A-posteriori-Methoden werden durch die empirische Prozesstheorie zu algebraischen Varietäten geklärt.

Rodrigo de Azevedo
quelle
Vielen Dank für den Hinweis - dieses Buch scheint die bisher beste Empfehlung zu sein! Ich werde es bald bekommen müssen. Auch für alle Interessierten hier ist eine Frage auf dieser Website zu diesem Buch: stats.stackexchange.com/questions/22391/…
Chill2Macht