Ich suche nach Empfehlungen für Bücher über Kredit-Scoring. Ich interessiere mich für alle Aspekte dieses Problems, aber hauptsächlich für: 1) Gute Funktionen. Wie baue ich sie? Welche haben sich als gut erwiesen? 2) Neuronale Netze. Ihre Anwendung auf Kredit-Scoring-Problem. 3) Ich habe neuronale Netze gewählt, interessiere mich aber auch für andere Methoden.
11
Antworten:
Wenn Sie neu in der Scoring-Welt sind, sollte Ihr erstes Buch von naeem siddiqi über Kredit-Scoring mit SAS sein. Wenn Sie nicht am Unterricht teilgenommen haben, machen Sie es. Das Hauptaugenmerk der Klasse liegt auf dem allgemeinen Verständnis der Bewertung und des Verkaufs von SAS Enterprise Miner für Millionen von Dollar.
Wenn Sie Theorie benötigen, benötigen Sie eine kategoriale Datenanalyse- und Data Mining-Klasse von einer nahe gelegenen Universität. Auch nach diesen Kursen benötigen Sie noch Hilfe.
Derzeit werden die beliebtesten Techniken verwendet
Clustering, Diskriminanzanalyse, Faktoranalyse und Hauptkomponenten sind ebenfalls ein Muss.
Das Kredit-Scoring von Elizabeth Mays gibt Ihnen auch einen guten Überblick.
Ich nahm auch an einem Kreditrisikomodellierungskurs des SAS-Instituts teil, der mir ein wenig half. Es ist ein ständiger Lernprozess und wird nie durchgeführt.
Bayesianische Leute mögen auch ihre Methoden.
Bearbeiten
Ich habe auch vergessen zu erwähnen. Die logistische Regression ist die beliebteste Technik, die es gibt, und wird immer diejenige sein, die Banken weiterhin verwenden werden. Es ist sehr schwierig, andere Methoden an die Mitarbeiter des oberen Managements zu verkaufen, es sei denn, Ihre Bank ist bereit, sich weniger um das Verständnis dieser Methoden zu kümmern, und ihr Fokus bleibt auf Risikobereitschaft und Geldverdienen.
quelle
Ich arbeite im Bereich Kredit-Scoring. Obwohl ich gerne verschiedene Ansätze erforsche, finde ich, dass logistische Regression oft gut genug ist, wenn nicht der beste Ansatz. Ich habe die neuesten Artikel zu diesem Thema nicht untersucht, aber aus dem Gedächtnis in den meisten Artikeln werden Sie sehen, dass andere Ansätze wie das Modell neuronaler Netze in der Regel keinen signifikanten Anstieg der Vorhersagekraft bieten (gemessen von GINI und AR). Außerdem sind diese Modelle für Laien in der Regel viel schwieriger zu verstehen (häufig haben die meisten leitenden Angestellten keinen statistischen Hintergrund), und der Scorecard-Ansatz mit logistischer Regression scheint die am einfachsten zu erklärenden Modelle zu bieten. Richtig, die meisten Scorecards berücksichtigen keine Interaktionen.
Allerdings gab es in letzter Zeit einige Interessen daran, Scorecards mithilfe von Überlebensanalysetechniken zu erstellen, da dies einige Vorteile gegenüber der logistischen Regression bietet. Wir können nämlich leichter makroökonomische Faktoren in das Modell einbeziehen, wir können neuere Daten in den Modellaufbau verwenden, anstatt uns auf Daten vor mindestens 12 Monaten verlassen zu müssen (da der binäre Indikator in der Logistik normalerweise als voreingestellt innerhalb des Modells definiert wird nächste 12 Monate). In dieser Hinsicht könnte meine These eine andere Perspektive bieten, indem sie die Erstellung von Kredit-Scorecards mithilfe der Überlebensanalyse untersucht. Ich habe gezeigt, wie Scorecards für die Überlebensanalyse genauso aussehen und sich genauso anfühlen wie Scorecards für die logistische Regression. Daher können sie ohne allzu große Probleme eingeführt werden.
In meiner Arbeit habe ich auch den ABBA-Algorithmus beschrieben, der ein neuartiger Ansatz zum Binning von Variablen ist.
https://www.google.com.sg/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CDAQFjAA&url=http%3A%2F%2Fftpmirror.your.org%2Fpub%2Fwik% 2Fwikipedia% 2Fcommons% 2F2% 2F2F% 2FAbout_Time _-_ Building_Credit_Scorecards_with_Survival_Analysis.pdf & ei = 8D8MUorrJs2Trgf56YCwCQ & usg = AFQjCNGxWRH1naJS4UqH_ckwzTx3GsaP8g & sig2 = kcEvjUUcn_wT93igxpYYDA & bvm = bv.50768961, d.bmk
Update: Ich mache keinen Anspruch darauf, ob meine These gut ist. Es ist nur eine andere Perspektive von einem Praktizierenden auf dem Gebiet.
quelle
quelle