Für eine Kostenmatrix ist
L=[010.50]c1c2predictionc1c2truth
Der Verlust der Vorhersage der Klasse wenn die Wahrheit Klasse c 2 ist, beträgt L 12 = 0,5 , und die Kosten der Vorhersage der Klasse c 2, wenn die Wahrheit Klasse c 1 ist, betragen L 21 = 1 . Es gibt keine Kosten für korrekte Vorhersagen, L 11 = L 22 = 0 . Das bedingte Risiko R für die Vorhersage einer der Klassen k ist dannc1c2L12=0.5c2c1L21=1L11=L22=0Rk
Eine Referenz finden Sie in diesenHinweisenauf Seite 15.
R(c1|x)R(c2|x)=L11Pr(c1|x)+L12Pr(c2|x)=L12Pr(c2|x)=L22Pr(c2|x)+L21Pr(c1|x)=L21Pr(c1|x)
Um das Risiko / den Verlust zu minimieren, prognostizieren Sie wenn die Kosten aus dem Fehler (dies ist der Verlust der falschen Vorhersage multipliziert mit der hinteren Wahrscheinlichkeit, dass die Vorhersage falsch ist L 12 Pr ( c 2 | x ) ) geringer sind als die Kosten für die falsche Vorhersage der Alternative,c1L12Pr(c2|x)
wobei die zweite Zeile die Bayes'sche RegelPr(c2|x)∝Pr(x|c2)Pr(c2) verwendet. Bei gleichen vorherigen WahrscheinlichkeitenPr(c1)=Pr(c2)=0,5 erhaltenSie
1
L12Pr(c2|x)L12Pr(x|c2)Pr(c2)L12Pr(c2)L21Pr(c1)<L21Pr(c1|x)<L21Pr(x|c1)Pr(c1)<Pr(x|c1)Pr(x|c2)
Pr(c2|x)∝Pr(x|c2)Pr(c2)Pr(c1)=Pr(c2)=0.512<Pr(x|c1)Pr(x|c2)
Sie klassifizieren also eine Beobachtung als wenn das Wahrscheinlichkeitsverhältnis diesen Schwellenwert überschreitet. Jetzt ist mir nicht klar, ob Sie den "besten Schwellenwert" in Bezug auf die Wahrscheinlichkeitsverhältnisse oder in Bezug auf das Attribut x wissen wollten . Die Antwort ändert sich je nach Kostenfunktion. Verwendung des Gaußschen in der Ungleichung mit σ 1 = σ 2 = σ und μ 1 = 0 , μ 2 = 1 ,
1c1xσ1=σ2=σμ1=0μ2=1
12log(12)log(12)xσ2x<12π√σexp[−12σ2(x−μ1)2]12π√σexp[−12σ2(x−μ2)2]<log(12π−−√σ)−12σ2(x−0)2−[log(12π−−√σ)−12σ2(x−1)2]<−x22σ2+x22σ2−2x2σ2+12σ2<12σ2−log(12)<12−log(12)σ2
so a prediction threshold in terms of
x as you search for can only be achieved if the losses from false predictions are the same, i.e.
L12=L21 because only then can you have
log(L12L21)=log(1)=0 and you get the
x0<12.