Zinkevichs "Online-Konvexoptimierung" ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) verallgemeinert die Lernalgorithmen zur "Minimierung des Bedauerns" von einer linearen Einstellung auf eine konvexe Einstellung und gibt eine gute "externe Bedauern" . Gibt es eine ähnliche Verallgemeinerung für internes Bedauern? (Ich bin mir nicht ganz sicher, was genau das bedeuten würde.)
19
Antworten:
Probieren Sie "No-Regre-Learning in konvexen Spielen" von Gordon, Greenwald und Marks http://portal.acm.org/citation.cfm?id=1390202 . Das Abstract klingt so, als würde es wahrscheinlich Ihre Frage beantworten, oder zumindest würde jemand, der diese Frage beantwortet, von diesem Artikel zitieren oder zitiert werden.
quelle
Dieses Avrim Blum-Papier weist auf einen Zusammenhang zwischen äußerem und innerem Bedauern hin. Laut seiner Zusammenfassung ist externa regret ein Maß dafür, wie schlecht ein Algorithmus mit der besten festen Aktion verglichen wird, während internes Bedauern mit der besten Variation dieser Methode verglichen wird (beste feste Permutation von Ausgaben wie Berichtsklasse A, wenn der ursprüngliche Algorithmus dies meldet Klasse b).
quelle