Survival Analysis in ambito bancario

La Survival Analysis è un ramo della statistica che si occupa di modellizzare l’accadimento di un evento in relazione al tempo.

Il campo di applicazione principale è la demografia, specialmente nello studio della mortalità umana. Sono stati creati modelli parametrici che generano principalmente 2 funzioni: la funzione di sopravvivenza S(t), che rappresenta la probabilità che l’evento sia posteriore al tempo t, e la Hazard Curve h(t), che descrive l’intensità del fenomeno al tempo t.

Una possibile applicazione, in ambito bancario, può essere la descrizione del rischio di credito per i contratti in portafoglio. In pratica, l’evento “morte” accade se il contratto ha n rate in arretrato (quindi current delinquency maggiore di n). Tale analisi è di tipo absorbing, poichè se un contratto “muore”, esce definitivamente dalla popolazione. L’altra causa di uscita dalla popolazione è la censura: il contratto si estingue anticipatamente o non accade nessun evento nel periodo dell’analisi.

La nozione di Hazard Curve si potrebbe quindi avvicinare ad un indicatore molto utilizzato in ambito bancario, le Vintage absorbing, dato che il concetto è identico: rapporto tra numeri di contratti “morti” al tempo t e numero di contratti totali. Ma gli andamenti si sono rilevati completamente differenti per 2 motivi: per le Vintage il numeratore è non decrescente (i contratti in malus continuano a essere considerati successivamente, a differenza dell’Hazard Curve dove si contano per ogni istante t), mentre il denominatore è costante (nell’Hazard Curve elimino tutti i contratti “morti”).

Attraverso la PROC LIFETEST di SAS, è possibile effettuare interessanti analisi con varie finalità:

- Confrontare gli andamenti di S(t) e h(t), fissata una coorte di contratti, in funzione delle spaccature considerate significative; nel caso si considerino più variabili, vengono create tutte le possibili combinazioni tra le categorie delle spaccature.

- Confrontare gli andamenti di S(t) e h(t), fissata una coorte di contratti, in funzione dei livelli di CD

- Confrontare gli andamenti di S(t) e h(t), fissato un livello di CD, in funzione delle coorti (per analizzare l’andamento nel tempo)

Il programma in SAS produce in automatico tutti i grafici e le statistiche: queste analisi sono utili per capire i trend temporali o in che modo alcune variabili di spaccatura infliuenzano i rischi dei contratti.

La Survival Analysis permette anche uno sviluppo modellistico, attraverso 2 modalità:

- modelli che stimano le funzioni di sopravvivenza e le curve Hazard, in funzione delle variabili categoriche considerate significative; risulta necessario ipotizzare a priori una distribuzione (Gamma, LogNormale, LogLogistica,…) per la stima dei parametri

-  modelli che prevedono l’evoluzione della funzione di sopravvivenza S(t), in funzione del tempo; vengono generalmente utilizzate funzioni secondarie per modellizzare la S(t), poiché più riconducibili ad una retta

Nel primo caso si ha un modello dipendente da n+1 variabili: il tempo t e le n variabili considerate significative; nel secondo caso, il modello dipenderà solo dal tempo (attraverso una procedura simile alla regressione lineare).

In definitiva, la Survival Analysis applicata in campo bancario può essere utile per vari motivi:

- riconoscimento delle variabili di spaccatura maggiormente significative
- riconoscimento di come tali variabili influiscano sulle current delinquency
- andamenti temporali della funzione di sopravvivenza
- previsione della curva di sopravvivenza per 6 mesi
- stima della curva di sopravvivenza in funzione delle variabili significative