Statistics.com hat ein Problem der Woche veröffentlicht: Die Rate der Betrugsfälle bei Wohnversicherungen beträgt 10% (jeder zehnte Schadensfall ist betrügerisch). Ein Berater hat ein maschinelles Lernsystem vorgeschlagen, um Ansprüche zu überprüfen und sie als Betrug oder Nichtbetrug zu klassifizieren. Das System erkennt betrügerische Angaben zu 90% und klassifiziert betrugsfreie Angaben nur zu 80% (fälschlicherweise wird jede fünfte Angabe als „Betrug“ bezeichnet). Wenn das System eine Forderung als betrügerisch einstuft, wie hoch ist die Wahrscheinlichkeit, dass sie tatsächlich betrügerisch ist?
https://www.statistics.com/news/231/192/Conditional-Probability/?showtemplate=true
Mein Kollege und ich haben beide unabhängig voneinander dieselbe Antwort gefunden, die nicht mit der veröffentlichten Lösung übereinstimmt.
Unsere Lösung:
(.9 * .1) / (.9 * .1) + (.2 * .9)) = 1/3
Ihre Lösung:
Dies ist ein Problem bei der bedingten Wahrscheinlichkeit. (Es ist auch ein Bayes'sches Problem, aber das Anwenden der Formel in der Bayes'schen Regel hilft nur dabei, die Vorgänge zu verschleiern.) Betrachten Sie 100 Behauptungen. 10 ist betrügerisch, und das System kennzeichnet 9 von ihnen korrekt als "Betrug". 90 Forderungen sind in Ordnung, aber das System klassifiziert fälschlicherweise 72 (80%) als "Betrug". Insgesamt wurden 81 Forderungen gekennzeichnet als betrügerisch, aber nur 9 von ihnen, 11%, sind tatsächlich betrügerisch.
Wer hatte recht?
quelle
Antworten:
Ich glaube, dass Sie und Ihr Kollege Recht haben. Statistics.com hat die richtige Denkweise, macht aber einen einfachen Fehler. Von den 90 "OK" -Anträgen erwarten wir, dass 20% fälschlicherweise als Betrug eingestuft werden, nicht 80%. 20% von 90 sind 18, was zu 9 korrekt identifizierten und 18 inkorrekten Ansprüchen mit einem Verhältnis von 1/3 führt, genau das, was die Bayes-Regel ergibt.
quelle
Du hast Recht. Die Lösung, die die Website veröffentlicht hat, basiert auf einer Fehlinterpretation des Problems, da 80% der nicht betrügerischen Ansprüche als betrügerisch eingestuft werden anstatt der angegebenen 20%.
quelle