Was ist mit dem Begriff "Prior" im maschinellen Lernen gemeint?

12

Ich bin neu im maschinellen Lernen. Ich habe mehrere Artikel gelesen, in denen sie Deep Learning für verschiedene Anwendungen eingesetzt haben und in den meisten Fällen des Modelldesigns den Begriff "Prior" verwendet haben, beispielsweise in der Posenschätzung des menschlichen Körpers. Kann jemand erklären, was es eigentlich bedeutet. Die mathematische Formulierung von vor und nach konnte ich nur in den Tutorials finden.

Amy
quelle
5
Es ist ein mathematisches Konzept, also ja, es ist mathematisch formuliert. Die Wikipedia-Seite scheint jedoch viel Intuition zu vermitteln. Hast du es überprüft? Wenn ja, können Sie mehr darüber sagen, was Sie nicht verstanden haben und wonach Sie in einer Antwort suchen?
David Richerby
@ David Richerby . Danke für Ihre Antwort. Ja, ich hatte diese Wikipedia-Seite überprüft und konnte mir eine vage Vorstellung machen, dass es sich um Wissen oder Informationen über eine Variable handelt. Ich hatte Artikel über die Schätzung der Körperhaltung gelesen, in denen Körperposenprioren, kinematische Körperpriorität, Modellierung von Priors über 3D-Pose für Menschen, Lernprioren vor der Schätzung der 3D-Pose für Menschen erwähnt wurden. Ich konnte nicht klar herausfinden, was der Begriff "Prior" in diesem Zusammenhang tatsächlich bedeutet.
Amy

Antworten:

13

Einfach ausgedrückt und ohne mathematische Symbole bedeutet Prior anfängliche Überzeugungen über ein Ereignis in Bezug auf die Wahrscheinlichkeitsverteilung . Sie richten dann ein Experiment ein und erhalten einige Daten. Anschließend "aktualisieren" Sie Ihren Glauben (und damit die Wahrscheinlichkeitsverteilung) entsprechend dem Ergebnis des Experiments (der posterioren Wahrscheinlichkeitsverteilung).

Beispiel: Angenommen, wir erhalten zwei Münzen. Aber wir wissen nicht, welche Münze gefälscht ist. Münze 1 ist unvoreingenommen (KÖPFE und SCHWÄNZE haben eine Wahrscheinlichkeit von 50%), und Münze 2 ist voreingenommen, sagen wir, wir wissen, dass sie KÖPFE mit einer Wahrscheinlichkeit von 60% ergibt. Mathematisch:

p(H|Coin1)=0.4
p(H|Coin2)=0.6

Das ist alles, was wir wissen, bevor wir ein Experiment durchführen.

Jetzt werden wir eine Münze auswählen und anhand der Informationen, die wir haben (H oder T), erraten, welche Münze wir ausgewählt haben (Münze 1 oder Münze 2).

p(Coin1)=p(Coin2)=0.5

p(Coin1|H)=p(H|Coin1)p(Coin1)p(H|Coin1)p(Coin1)+p(H|Coin2)p(Coin2)=0.4×0.50.4×0.5+0.6×0.5=0.4

p(Coin2|H)=p(H|Coin2)p(Coin2)p(H|Coin1)p(Coin1)+p(H|Coin2)p(Coin2)=0.6×0.50.4×0.5+0.6×0.5=0.6

0.5

Dies ist das Grundprinzip der Bayes'schen Inferenz und Statistik, die beim maschinellen Lernen verwendet werden.

fade2black
quelle
2
Sie müssen das obige Beispiel korrigieren. Diese Berechnung zeigt, dass beide Münzen voreingenommen sind (erste mit einer Wahrscheinlichkeit von 40% und die zweite mit einer Wahrscheinlichkeit von 60%). Falls die erste voreingenommen ist, handelt es sich immer noch um eine Bernoulli-Verteilung, jedoch mit Wahrscheinlichkeiten P (Coin1 | H). = 5/11 und P (Coin2 | H) =
6/11
Sollte "Wenn wir KÖPFE haben, beträgt die Wahrscheinlichkeit, dass es sich um Münze 1 handelt, 0,4" umgeschrieben werden als "Wenn wir Münze 1 haben, beträgt die Wahrscheinlichkeit, dass es sich um KÖPFE handelt, 0,4" ?
Mateen Ulhaq