Cao, Ricardo, Vilar, Juan M., Peláez, Rebeca, Cao, Ricardo, Vilar, Juan M., and Peláez, Rebeca
[Abstract] Financial institutions are interested in knowing the probability that their clients declare themselves unable to pay the debts incurred by granting a credit. The aim of this work is to propose models to estimate this probability, called probability of default (PD), using the information provided by the credit scoring. The PD conditional on the credit scoring can be written as a transformation of the conditional survival function of the variable “time to default”. This property is used to propose new PD estimators, based on nonparametric estimators of the survival function. The time to default faces a right-censoring problem, since in the study of a set of loans, it is not possible to observe default for all of them. Consequently, censored data techniques and survival analysis are used. Given the possible existence of individuals not susceptible to default, mixture cure models are also discussed in this work. The asymptotic expression for the mean squared error and the asymptotic normality of the proposed estimators are obtained. Automatic bootstrap selectors are proposed for the smoothing parameters on which the estimators depend. The performance of the proposed techniques is analysed and compared with existing semiparametric approaches through simulation studies and illustrated by analysing bank loan data, [Resumen] A las entidades financieras les interesa conocer la probabilidad de que sus clientes se declaren incapaces de hacer frente a las deudas contraídas con la concesión de un crédito. El objetivo de este trabajo es proponer modelos para estimar esta probabilidad, denominada probabilidad de mora (PD), utilizando la información proporcionada por la puntuación crediticia. La PD condicionada a la puntuación crediticia puede escribirse como una transformaciónde la función de supervivencia condicional de la variable “tiempo hasta la mora”. Esta propiedad se utiliza para proponer nuevos estimadores de la PD, basados en estimadores no paramétricos de la función de supervivencia. El tiempo hasta el impago se enfrenta a un problema de censura por la derecha, pues en elestudio de un conjunto de créditos, no es posible observar la mora para todos ellos. Consecuentemente, se utilizan técnicas de datos censurados y análisis de supervivencia. Ante la posible existencia de individuos no susceptibles a la mora, los modelos de curación de tipo mixtura también se discuten en este trabajo. Se obtiene la expresión asintótica para el error cuadrático medio y la normalidad asintótica de los estimadores propuestos. Se proponen selectores automáticos bootstrap para los parámetros de suavizado de los que dependen los estimadores. El comportamiento de las técnicas propuestas se analiza y se compara con enfoques semiparamétricos existentes mediante estudios de simulación y se ilustra mediante el análisis de datos de préstamos bancarios., [Resumo] Ás entidades financeiras interesalles coñecer a probabilidade de que os seus clientes declárense incapaces de facer fronte ás débedas contraídas coa concesión dun crédito. O obxectivo deste traballo é propoñer modelos para estimar esta probabilidade, denominada probabilidade de morosidade (PD), utilizando a información proporcionada pola puntuación crediticia. A PD condicionada á puntuación crediticia pode escribirse como unha transformación da función de supervivencia condicional da variable “tempo ata a morosidade”. Esta propiedade utilízase para propoñer novos estimadores da PD, baseados en estimadores non paramétricos da función de supervivencia. O tempo ata a falta de pagamento enfróntase a un problema de censura pola dereita, pois no estudo dun conxunto de créditos, non é posible observar a falta de pagamento para todos eles. Consecuentemente, utilízanse técnicas de datos censurados e análise de supervivencia. Ante a posible existencia de individuos non susceptibles á morosidade, os modelos de curación de tipo mestura tamén se discuten neste traballo. Obtense a expresión asintótica para o erro cuadrático medio e a normalidade asintótica dos estimadores propostos. Propóñense selectores automáticos bootstrap para os parámetros de suavizado dos que dependen os estimadores. O comportamiento das técnicas propostas analízase e compárase con enfoques semiparamétricos existentes mediante estudos de simulación e ilústrase mediante a análise de datos de préstamos bancarios.