PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Czasopismo
1999 | nr 5 | 57--63
Tytuł artykułu

Scoring logitowy w praktyce bankowej a zagadnienie koincydencji

Warianty tytułu
Logit Scoring in the Banking Practice and the Problem of Coincidence
Języki publikacji
PL
Abstrakty
Punktacja, czyli scoring klienta instytucji finansowej, jest syntetycznym wskaźnikiem, określającym poziom ryzyka związanego z wnioskiem o kredyt bądź inny produkt finansowy. Artykuł przedstawia jeden z modeli statystycznych wykorzystywany przy budowaniu karty punktowej w banku. Jest to dwumianowy model logitowy, w którym zmienna zależna Y jest zmienną binarną (zerojedynkową), natomiast prawdopodobieństwo, że Y = 1 określa się za pomocą rozkładu logistycznego. Dla danego wnioskuY = 1 oznacza, że kredyt zostaje przyznany, a Y = 0 oznacza, że wniosek o kredyt jest odrzucony. Zmiennymi egzogenicznymi modelu są predyktory zmiennej Y. Jedna z własności modelu logitowego polega na tym, że znak parametru przy nieujemnej zmiennej egzogenicznej X pokazuje kierunek wpływu tej zmiennej na Y. Jeśli ten parametr jest dodatni, wówczas wzrost X wiąże się ze wzrostem szans na to, że Y = 1. Dla ujemnego parametru: wyższym wartościom X odpowiada niższe prawdopodobieństwo tego, że Y = 1. Oznacza to, że specyfikacja modelu może uwzględniać postulat koincydencji, to jest równości znaków parametrów dla zmiennych egzogenicznych ze znakami odpowiednich współczynników korelacji. W artykule przedstawiono ilustrację liczbową (opartą na danych symulowanych) podejścia do specyfikacji modelu logitowego dla 1.200 wniosków, z których 600 dotyczy kredytów zaakceptowanych, natomiast pozostałych 600 wniosków jest odrzuconych. Potencjalne predyktory (zmienne egzogeniczne) obejmują grupę zmiennych mierzalnych na skali przedziałowej, takich jak dochód roczny klienta lub liczba lat pracy. Ponadto, do predyktorów należą zmienne zerojedynkowe: poziom wykształcenia, stan cywilny itp. Pierwszy etap specyfikacji dotyczy doboru predyktorów zgodnie z następującymi kryteriami:
1. predyktory są słabo skorelowane między sobą,
2. są mocno skorelowane ze zmienną Y.
Dobór odbywa się na podstawie analizy macierzy, obrazującej poziom i kierunek współzależności między wszystkimi możliwymi parami zmiennych X i Y. Jeśli co najmniej jedna ze zmiennych w parze jest zmienną zerojedynkową, wówczas współczynnik korelacji należy zastąpić odpowiednią miarą asocjacji. Proponuje się dwie takie miary:
1. współczynnik skojarzenia Yule'a, jeśli obie zmienne w parze są zmiennymi zerojedynkowymi,
2. wynik testu t dla różnicy średnich, w przypadku gdy jedna ze zmiennych jest zmienną zerojedynkową, a drugą jest zmienną mierzalną na skali przedziałowej.
Na drugim etapie następuje estymacja modeli logitowych dla predyktorów wybranych w pierwszym etapie, przy czym dodatkowo modele bada się pod kątem koincydencji. Postulat koincydencji nie jest powszechnie akceptowany w ekonometrii. Jednakże w przypadku, gdy obie zmienne Y i X są zerojedynkowe, spełnienie tego postulatu w modelu jest uzasadnione. Załóżmy, że proponujemy dwa wnioski kredytowe, dla których wartości wszystkich zmiennych X są identyczne poza jedną: równą 0 dla pierwszego wniosku oraz równą 1 dla drugiego wniosku. Jeśli miara współzależności tej zmiennej ze zmienną Y jest dodatnia, to należy oczekiwać, że prognoza prawdopodobieństwa zdarzenia Y = 1 dla drugiego wniosku będzie wyższa niż dla pierwszego. Oznacza to, że parametr przy tej zmiennej w modelu logitowym powinien mieć znak dodatni, czyli powinien być spełniony postulat koincydencji. Wykorzystywanie zasady koincydencji przy doborze predyktorów wzbogaca zatem efektywność poszukiwania optymalnej dla banku karty scoringowej. (abstrakt oryginalny)
EN
Credit score is a composite index used for the evaluation of risk associated with a customer's application for a loan or other financial product. The paper considers one of the statistical models serving as a tool for devising the application scoring in a bank. This is the binomial logit model, in which the dependent variable Y is binary (0 or 1) and the probability of Y = 1 is defined in terms of a logistic distribution. For an application, Y = 1 denotes that the loan is booked and Y = 0 means that the loan is refused. The model's exogenous variables are the predictors of Y. The feature of the logit model is that the sign of the parameter for a nonnegative exogenous variable X shows the direction of its effect on Y. If this parameter is positive, then the higher values of X are to be associated with the higher chances that Y = 1. For a negative parameter: the higher values of X correspond to the lower probability that Y = 1. This means that the process of model's specification may take into account the postulate of coincidence, i.e. the equality of signs of the exogenous variables' parameters with the corresponding simple correlation coefficient. Paper presents the numerical illustration (based on simulated data) of the approach to specification of the logit model for 1200 applications, of which 600 were accepted and 600 were rejected. The intended predictors (exogenous variables) include a set of numerical variables, measured on a ratio scale, such as applicant's annual income or number of years in work. Also, the predictors include the dummy (binary) variables such as education level, marital status etc. Firstly, the predictors are selected according to the following rules:
1. Weak correlation among predictors,
2. Strong correlation between predictors and the Y variable.
This is done by the inspection of the matrix showing the level and direction of association between all possible pairs of variables X and Y. If at least one of the variables in a pair is binary, the simple correlation is replaced by a measure of association. There are two proposals of such measure:
1. Yule association coefficient, if both variables are binary,
2. The outcome of the t-test for means if one of the variables is binary and second variable is measured on a ratio scale.
Secondly, logit models for the selected sets of predictors are estimated and examined in terms of the coincidence property. The postulate of coincidence is not widely accepted in econometrics. However, in the case when both Y and X are binary, the requirement of coincidence is justified. Consider two loan applications, for which the values of all X variables are the same exept for one X variable that is equal 0 for the first application and 1 for the second application. If the association between this variable and Y is positive, then it should be expected that the probability of Y = 1 is higher for the second application as compared to the first one. This means that the parameter for this variable in the logit model should be positive, i.e. the model should have the property of coincidence. Therefore, the use of coincidence property may improve the process of finding optimal rule of credit scoring. (original abstract)
Czasopismo
Rocznik
Numer
Strony
57--63
Opis fizyczny
Twórcy
Bibliografia
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171265209

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.