Was ist "Ablehnen-Inferenz" und wie kann es verwendet werden, um die Genauigkeit eines Modells zu erhöhen?

10

Kann jemand im Detail erklären:

  1. Was bedeutet Ablehnung ablehnen?
  2. Wie kann es verwendet werden, um die Genauigkeit meines Modells zu erhöhen?

Ich habe die Idee, Rückschlüsse bei Kreditkartenanwendungen abzulehnen, habe aber Probleme mit dem Gedanken, sie zur Erhöhung der Genauigkeit meines Modells zu verwenden.

Ayush Biyani
quelle

Antworten:

23

Beim Erstellen von Kreditmodellen ist das Ablehnen von Rückschlüssen der Prozess des Ableitens der Leistung von Kreditkonten, die im Antragsverfahren abgelehnt wurden.

Wenn wir ein Anwendungskreditrisikomodell erstellen, möchten wir ein Modell erstellen, das " durch die Tür " anwendbar ist, dh wir geben alle Anwendungsdaten in das Kreditrisikomodell ein und das Modell gibt eine Risikobewertung oder eine Wahrscheinlichkeit aus von Standard. Das Problem bei der Verwendung der Regression zum Erstellen eines Modells aus früheren Daten besteht darin, dass wir die Leistung des Kontos nur für in der Vergangenheit akzeptierte Anwendungen kennen. Wir kennen jedoch die Leistung der Ablehnungen nicht, da wir sie nach der Bewerbung wieder aus der Tür geschickt haben. Dies kann zu einer Auswahlverzerrung in unserem Modell führen, da das Modell möglicherweise keine gute Leistung für die "durch die Tür" -Population erbringt, wenn wir in unserem Modell nur frühere "Akzeptierungen" verwenden.

Es gibt viele Möglichkeiten, mit Ablehnungsinferenzen umzugehen, die alle umstritten sind. Ich werde hier zwei einfache erwähnen.

  • "Vergangene Ablehnungen als schlecht definieren"
  • Paketierung

"Vergangene Ablehnungen als schlecht definieren" bedeutet einfach, alle abgelehnten Anwendungsdaten zu übernehmen und sie beim Erstellen des Modells nicht zu verwerfen, sondern alle als schlecht zuzuweisen. Diese Methode führt das Modell stark in Richtung der bisherigen Akzeptanz- / Ablehnungspolitik.

"Parceling" ist etwas anspruchsvoller. Es besteht aus

  1. Erstellen Sie das Regressionsmodell mit der Vergangenheit "akzeptiert"
  2. Wenden Sie das Modell auf die Ablehnungen der Vergangenheit an, um ihnen Risikobewertungen zuzuweisen
  3. Ordnen Sie die abgelehnten Anträge unter Verwendung der erwarteten Ausfallwahrscheinlichkeit für jede Risikobewertung entweder gut oder schlecht zu. Wenn die Risikobewertung beispielsweise eine Ausfallwahrscheinlichkeit von 10% aufweist und 100 abgelehnte Anträge in diese Risikobewertung fallen, weisen Sie 10 der Ablehnungen "schlecht" und 90 der Ablehnungen "gut" zu.
  4. Erstellen Sie das Regressionsmodell mithilfe der akzeptierten Anwendungen und der daraus abgeleiteten Leistung der abgelehnten Anwendungen neu

In Schritt 3 gibt es verschiedene Möglichkeiten, die Zuweisungen zu gut oder schlecht vorzunehmen. Dieser Prozess kann auch iterativ angewendet werden.

Wie bereits erwähnt, ist die Verwendung der Zurückweisung von Ablehnungen umstritten, und es ist schwierig, eine eindeutige Antwort darauf zu geben, wie sie zur Erhöhung der Genauigkeit von Modellen verwendet werden kann. Ich werde einfach einige andere zu diesem Thema zitieren.

Jonathan Crook und John Banasik, Verbessert die Ablehnung von Inferenzen die Leistung von Anwendungsbewertungsmodellen wirklich?

Erstens erscheint der Spielraum für Verbesserungen eines Modells, das nur auf den akzeptierten basiert, bescheiden, selbst wenn ein sehr großer Teil der Antragsteller abgelehnt wird. Wenn die Ablehnungsrate nicht so hoch ist, scheint dieser Umfang tatsächlich sehr klein zu sein.

David Hand, "Direct Inference in Credit Operations", erscheint im Handbook of Credit Scoring, 2001

Es wurden verschiedene Methoden vorgeschlagen und verwendet, und obwohl einige von ihnen eindeutig schlecht sind und niemals empfohlen werden sollten, gibt es keine eindeutige beste Methode für die universelle Anwendbarkeit, es sei denn, es werden zusätzliche Informationen eingeholt. Das heißt, die beste Lösung besteht darin, mehr Informationen (möglicherweise durch Gewährung von Darlehen an einige potenzielle Ablehnungen) über diejenigen Antragsteller zu erhalten, die in die Ablehnungsregion fallen.

Derek Ploor
quelle
1
+1 für einen umfassenden Überblick. Jetzt weiß ich auch, was Rückschluss ablehnen ist :)
mpiktas
1
Vielen Dank. aber wie ordnen Sie in Schritt 3 zu? Ich habe gelesen, dass Sie bei Verwendung von 1 oder 0 die Wahrscheinlichkeit für jede Zeile verwenden können. Sie haben also dieselbe Person mit 10% und 90%. Wie kann dies mit einer neuen logistischen Modellerstellung funktionieren?
GabyLP
1

@GabyLP in früheren Kommentaren. Nach meiner Erfahrung können Sie solche Clients in zwei Teile aufteilen und für beide Aufteilungen je nach Wahrscheinlichkeit Gewichte zuweisen. Wenn ein abgelehnter Client beispielsweise 10% PD hat, können Sie aus diesem einen zwei Clients machen. Erstens mit der Zielvariablen 1 und dem Gewicht 0,1 und zweitens mit der Zielvariablen 0 und dem Gewicht 0,9.

Die gesamte akzeptierte Stichprobe von Kunden hat Gewichte == 1.

Dies funktioniert zwar mit logistischer Regression, jedoch nicht mit baumbasierten Modellen.

MiksL
quelle
Haben Sie eine Quelle für Ihre Aussage?
T. Beige
Wenn die Frage lautet, ob es bei baumbasierten Modellen nicht funktioniert, lautet meine Antwort: persönliche Erfahrung. Ich habe versucht, diesen Ansatz umzusetzen, aber es ist mir nicht gelungen.
MiksL