Survival Analysis applied in banking field

Survival Analysis is a branch of statistics that takes care of representing development of an event during a period of time.

Its main application is into demography, especially in the analysis of human mortality. Some survival models have been created to produce principally 2 functions: Survival Function S(t), which represents the odds that the event would happen after time t, and Hazard Curve h(t), that describes probability of the phenomenon at time t.

In banking field, one possible application is the description of credit risk. In concrete terms, the event “death” happens when a contract has n outstanding installments (in other terms, having current delinquency equal to n). This analysis is absorbing, because when the contract goes into this bad situation, it will definitively exit from portfolio population. Another way to go out from community is the censor: the contract finishes in advance or it has no outstanding installments during the period of analysis.

Hazard Curve’s notion could resemble another useful banking indicator, vintage absorbing, because the concept is the same: ratio between number of “dead contract” at time t and total number of contracts.

But their trends are completely different due to 2 reasons: vintage numerator is not decreasing (“dead contracts” continue to be considered, differing from Hazard Curve), while denominator is constant (starting portfolio, differing from Hazard Curve where population is decreasing).

Through PROC LIFETEST of SAS, it is possible to make interesting analysis with some aims:

- Compare developments of S(t) and h(t), with a fixed cohort of contracts, according on significant variables; if we consider more variables, SAS calculates every combinations among all the categories.

S(t) e h(t) of car loans of a bank with variable of new/used car

- Compare developments of S(t) and h(t), with a fixed cohort of contracts, depending of levels of current delinquency.

- Compare developments of S(t) and h(t), with a fixed level of current delinquency, depending on cohort (temporal analysis).

SAS program produces automatically graphics and statistics: this study could be useful to understand temporal trends or the way these variables influence credit risk in portfolio.

Furthermore Survival Analysis has a model development, through 2 ways:

- some models evaluating Survival Function S(t) and Hazard Curve h(t), also depending of other significant variables; at the beginning it’s necessary to suppose a specific distribution to estimate parameters (Gamma, LogNormal, LogLogistic);

- some models foreseeing development of Survival Function S(t), depending only by time t; in this process some secondary functions of S(t) are used, because they are mainly alike to a straight line;

In the first case, we’ll have a model as a function of n+1 variables (time t and n significant variables), while in the other, it will depend only by time (through a method similar to linear regression).

Summarizing, Survival Analysis applied in banking field could be useful for some reasons:

- identification of mainly significant variables of a phenomenon
- understanding the influence of these variables on currency delinquency
- development of Survival Function depending on time
- forecasting of Survival Function for next months
- forecasting of Survival Function depending of significant variables

Survival Analysis in ambito bancario

La Survival Analysis è un ramo della statistica che si occupa di modellizzare l’accadimento di un evento in relazione al tempo.

Il campo di applicazione principale è la demografia, specialmente nello studio della mortalità umana. Sono stati creati modelli parametrici che generano principalmente 2 funzioni: la funzione di sopravvivenza S(t), che rappresenta la probabilità che l’evento sia posteriore al tempo t, e la Hazard Curve h(t), che descrive l’intensità del fenomeno al tempo t.

Una possibile applicazione, in ambito bancario, può essere la descrizione del rischio di credito per i contratti in portafoglio. In pratica, l’evento “morte” accade se il contratto ha n rate in arretrato (quindi current delinquency maggiore di n). Tale analisi è di tipo absorbing, poichè se un contratto “muore”, esce definitivamente dalla popolazione. L’altra causa di uscita dalla popolazione è la censura: il contratto si estingue anticipatamente o non accade nessun evento nel periodo dell’analisi.

La nozione di Hazard Curve si potrebbe quindi avvicinare ad un indicatore molto utilizzato in ambito bancario, le Vintage absorbing, dato che il concetto è identico: rapporto tra numeri di contratti “morti” al tempo t e numero di contratti totali. Ma gli andamenti si sono rilevati completamente differenti per 2 motivi: per le Vintage il numeratore è non decrescente (i contratti in malus continuano a essere considerati successivamente, a differenza dell’Hazard Curve dove si contano per ogni istante t), mentre il denominatore è costante (nell’Hazard Curve elimino tutti i contratti “morti”).

Attraverso la PROC LIFETEST di SAS, è possibile effettuare interessanti analisi con varie finalità:

- Confrontare gli andamenti di S(t) e h(t), fissata una coorte di contratti, in funzione delle spaccature considerate significative; nel caso si considerino più variabili, vengono create tutte le possibili combinazioni tra le categorie delle spaccature.

- Confrontare gli andamenti di S(t) e h(t), fissata una coorte di contratti, in funzione dei livelli di CD

- Confrontare gli andamenti di S(t) e h(t), fissato un livello di CD, in funzione delle coorti (per analizzare l’andamento nel tempo)

Il programma in SAS produce in automatico tutti i grafici e le statistiche: queste analisi sono utili per capire i trend temporali o in che modo alcune variabili di spaccatura infliuenzano i rischi dei contratti.

La Survival Analysis permette anche uno sviluppo modellistico, attraverso 2 modalità:

- modelli che stimano le funzioni di sopravvivenza e le curve Hazard, in funzione delle variabili categoriche considerate significative; risulta necessario ipotizzare a priori una distribuzione (Gamma, LogNormale, LogLogistica,…) per la stima dei parametri

-  modelli che prevedono l’evoluzione della funzione di sopravvivenza S(t), in funzione del tempo; vengono generalmente utilizzate funzioni secondarie per modellizzare la S(t), poiché più riconducibili ad una retta

Nel primo caso si ha un modello dipendente da n+1 variabili: il tempo t e le n variabili considerate significative; nel secondo caso, il modello dipenderà solo dal tempo (attraverso una procedura simile alla regressione lineare).

In definitiva, la Survival Analysis applicata in campo bancario può essere utile per vari motivi:

- riconoscimento delle variabili di spaccatura maggiormente significative
- riconoscimento di come tali variabili influiscano sulle current delinquency
- andamenti temporali della funzione di sopravvivenza
- previsione della curva di sopravvivenza per 6 mesi
- stima della curva di sopravvivenza in funzione delle variabili significative