Ich habe in letzter Zeit viele Artikel über ADMM gelesen und auch versucht, einige Probleme damit zu lösen, bei denen es sehr effektiv war. Im Gegensatz zu anderen Optimierungsmethoden kann ich mir nicht vorstellen, wie und warum diese Methode so effektiv ist (natürlich habe ich in einigen Fällen eine Konvergenzanalyse gesehen, aber nichts, was mir zu viele Einblicke gab). Gibt es eine Intuition hinter ADMM? Wie kamen die ersten Wissenschaftler auf diese Idee? Eine gewisse geometrische Intuition wäre am besten, aber jede Einsicht, die jemand hat, wird helfen.
optimization
admm
Olamundo
quelle
quelle
Antworten:
Wenn ich mich richtig erinnere, wird das ADMM oft als Algorithmus angegeben, um für zwei konvexe zu lösen , nieder-halb Funktionales und und linear, beschränkte Operatoren und .
Ich finde den folgenden Sonderfall von , und illustrativ. In diesem Fall lautet die Einschränkung , dh wir können ersetzen, um das Problem Das Lösen kann nun schwierig sein, während das Lösen von Problemen der Form einfach sein kann. (Sie können sich selbst Beispiele dafür ausdenken, ein beliebtes ist und ). In ADMM beginnen Sie mit der "geteilten Form" und erstellen das "erweiterte Lagragian"A=I c = 0 x - y = 0B=−I c=0 x−y=0
Wenn Sie diese Minimierungsprobleme für und genauer analysieren , stellen Sie fest, dass für jedes Update nur ein Problem der "einfacheren Form" gelöst werden muss, z. B. für das Update (Vernachlässigung von Begriffen, die nicht von abhängen ).x y x
ADMM für das Problem wird ähnlich abgeleitet, aber dann sind die Zwischenprobleme für die Aktualisierungen immer noch a etwas schwierig, kann aber im Vergleich zum Original vergleichsweise einfach sein. Insbesondere im Fall von und (oder äquivalent , und die Einschränkung ) Die Aktualisierungen sind mehr oder weniger einfach zu implementieren.
quelle