Ich bin auf den Begriff Ratlosigkeit gestoßen, der sich auf die logarithmisch gemittelte inverse Wahrscheinlichkeit für unsichtbare Daten bezieht. Ein Wikipedia- Artikel über Ratlosigkeit gibt keine intuitive Bedeutung dafür.
Dieses Verwirrungsmaß wurde in pLSA- Papier verwendet.
Kann jemand die Notwendigkeit und die intuitive Bedeutung von Ratlosigkeit erklären ?
measurement
perplexity
Lerner
quelle
quelle
Antworten:
Sie haben den Wikipedia-Artikel über Ratlosigkeit gelesen . Es gibt die Verwirrung einer diskreten Verteilung als
was auch geschrieben werden könnte als
dh als gewichtetes geometrisches Mittel der Umkehrungen der Wahrscheinlichkeiten. Bei einer kontinuierlichen Verteilung würde die Summe zu einem Integral.
Der Artikel gibt auch eine Möglichkeit, die Verwirrung für ein Modell unter Verwendung von Testdaten zu schätzenN
was auch geschrieben werden könnte
oder auf eine Vielzahl anderer Arten, und dies sollte es noch klarer machen, woher die "log-durchschnittliche inverse Wahrscheinlichkeit" kommt.
quelle
Ich fand das ziemlich intuitiv:
http://planspace.org/2013/09/23/perplexity-what-it-is-and-what-yours-is/
quelle
Ich habe mich das auch gefragt. Die erste Erklärung ist nicht schlecht, aber hier sind meine 2 Nats für was auch immer das wert ist.
Ratlosigkeit hat vor allem nichts damit zu tun, wie oft man etwas Richtiges errät. Es hat mehr mit der Charakterisierung der Komplexität einer stochastischen Sequenz zu tun.
Löschen wir zuerst das Protokoll und die Potenzierung.
Ich denke, es ist erwähnenswert, dass Ratlosigkeit mit der Basis, die Sie zur Definition der Entropie verwenden, unvermeidlich ist. In diesem Sinne ist Ratlosigkeit unendlich viel eindeutiger / weniger willkürlich als Entropie als Maß.
Beziehung zu Würfeln
Ratlosigkeit ist also die Anzahl der Seiten eines fairen Würfels, die beim Würfeln eine Sequenz mit der gleichen Entropie wie Ihre gegebene Wahrscheinlichkeitsverteilung ergibt.
Anzahl der Staaten
Wenn Sie das Würfeln einer Seite des Würfels immer unwahrscheinlicher machen, sieht die Ratlosigkeit so aus, als ob die Seite nicht existiert.
quelle
Um zu erklären, ist die Verwirrung einer gleichmäßigen Verteilung X nur | X |, die Anzahl der Elemente. Wenn wir versuchen, die Werte zu erraten, die iid-Samples von einer gleichmäßigen Verteilung X annehmen, indem wir einfach iid-Ratschläge von X machen, werden wir 1 / | X | = 1 / Verwirrung der Zeit korrekt sein. Da die Gleichverteilung die am schwersten zu erratenden Werte sind, können wir 1 / Ratlosigkeit als Untergrenze / heuristische Näherung für die Häufigkeit unserer Vermutungen verwenden.
quelle