Ads Top

Usando Rede Neural Artificial para Gerenciamento do Risco de Crédito

O que é Risco de Crédito Financeiro?

risco de crédito
Risco de crédito

Risco de crédito financeiro é o risco de uma perda financeira que surge da capacidade de uma contraparte ou incapacidade de cumprir as suas obrigações acordadas no âmbito de um contrato financeiro. A análise de risco de crédito é um processo que identifica o devedor e quantifica o valor para pagar antecipadamente seu empréstimo. Os analistas adotam um ou os dois métodos a seguir para modelagem de risco de crédito:


  • Mineração de dados e/ou abordagem de aprendizado estatístico
  • Computação Natural e Modelagem Matemática

As principais métricas na modelagem de risco de crédito são; classificação de crédito (probabilidade de inadimplência), exposição no default e perda dada a inadimplência.

Normalmente, a classificação de crédito ou a probabilidade de cálculos de default são problemas de classificação e de árvore de regressão que classificam um cliente como "arriscado" ou "não-arriscado" ou prevêem as classes com base em dados passados. Embora a análise estatística tradicional e os modelos matemáticos sejam amplamente utilizados em vários cenários na análise de risco de crédito, os modelos de redes neurais são mais flexíveis e capazes de modelar funções complexas não lineares do que modelos estatísticos clássicos como análise discriminante linear e regressão logística. Por exemplo, um modelo de regressão logística é fácil de interpretar devido à sua combinação linear aditiva de entradas e peso, e também é ajustado por um algoritmo de aprendizagem. Mas dará resultados de baixa precisão em relações não lineares complexas. No entanto, para um modelo de rede neural usando uma função logística, seu maior número de camadas ocultas (H) permite que ele aprenda relações não-lineares complexas. De fato, uma rede neural com o valor de H = 0 é equivalente à regressão logística.

Um benefício das RNAs é que elas não exigem que a relação funcional entre variáveis dependentes e independentes seja explicitamente especificada. Como são máquinas de aprendizado conexionistas, o conhecimento é incorporado diretamente em um conjunto de pesos através dos arcos de vinculação entre os nós de processamento. 

Além disso, isso elimina a necessidade de descartar colunas de dados potencialmente autocorrelacionadas ou menos confiáveis ou importantes durante o processo de limpeza antes do treinamento do modelo. O processo de ponderação da RNA simplesmente atribui um peso menor às variáveis que ele prevê serem menos importantes.

Risco de crédito de bancos comerciais

Nesse cenário, um banco comercial possui dados históricos incompletos devido ao gerenciamento de risco de crédito desfasado. Um modelo de identificação de risco de crédito baseado em RNA pode realizar a aprendizagem on-line à medida que os dados são acumulados ao longo do tempo - uma tarefa que não pode ser alcançada pelos modelos tradicionais de mensuração de risco de crédito.

O modelo de identificação de risco de crédito é construído com base em um algoritmo de Propagação Antecipada (BP). O modelo baseado em RNA é primeiramente treinado no algoritmo de acordo com dados históricos. Em seguida, o modelo pode ser usado para identificar o risco de crédito das empresas devedoras, fornecendo suporte à decisão para o controle do risco de crédito.

Uma rede de propagação reversa geralmente começa com um conjunto aleatório de pesos. A rede ajusta seus pesos toda vez que vê um par de entrada-saída. Cada par é processado em dois estágios - um passe para frente e um para trás. 

O encaminhamento para frente envolve a apresentação de uma entrada de amostra para a rede e permite que as ativações fluam até atingirem a camada de saída. Propagação reversa padrão é um algoritmo de gradiente descendente, o que significa que os pesos da rede são movidos ao longo do negativo do gradiente da função de erro. Uma etapa de iteração do algoritmo pode ser escrita como:

W(t+1) = W(t) +μ(-∇E(t))

Onde W (t) é um vetor dos pesos na etapa de iteração t, ∇E (t) é o gradiente atual da função de erro e que normalmente é a soma dos erros quadrados, e μ é a taxa de aprendizado.

Para reduzir o tempo de treinamento, o algoritmo de aprendizado atualiza os pesos de acordo com o gradiente descendente com um momento adicional, β. [Nota: Este é um dos algoritmos BP com taxa de aprendizado adaptativo e momentum.]

W(t +1) =W(t) +μ (−∇E(t)) + βΔW(t −1)

E

ΔW(t) =μ (−∇E(t)) + βΔW(t −1)

Onde ΔW (t) é o ajuste atual dos pesos, β é o momento, e ΔW (t −1) é a mudança anterior para os pesos.

O momentum permite que uma rede responda não apenas ao gradiente local, mas também às tendências recentes na superfície de erro. Atuando como um filtro low-pass, o momentum permite que a rede ignore pequenos recursos no erro. 

A taxa de aprendizado e o momento são atualizados com valores otimizados durante o processo de treinamento através de um método de gradiente conjugado com a exploração das derivadas de primeira e segunda ordem de μ e β. 

Estes derivados podem ser calculados eficientemente e convenientemente durante cada passo de iteração de propagação inversa. Após o treinamento, o modelo pode ser usado para analisar os dados de uma empresa solicitante de empréstimos para identificação de risco de crédito.

Risco de crédito de clientes individuais


A maioria dos candidatos não é inadimplente nas avaliações de risco de crédito, e apenas um pequeno número de candidatos é inadimplente. Isso significa que o tamanho de amostra relativamente pequeno de clientes ruins em conjuntos de dados de crédito indica que as classes de dados estão extremamente desbalanceadas. 

Algoritmos de aprendizado padrão funcionam melhor para amostras de classe majoritária e geralmente apresentam um desempenho ruim em amostras de classes minoritárias (positivas). Esse desequilíbrio resulta em degradação do desempenho, o que torna a construção de um modelo preditivo desafiadora. No entanto, uma RNA alavancando clustering e fusão pode obter dados balanceados que podem avaliar com precisão se um cliente deve receber um empréstimo ou não.

Para começar, use um algoritmo de clustering como k-means para agrupar os subgrupos. O problema é que os algoritmos de aprendizado padrão são bons para amostras de classe majoritárias (negativas), mas geralmente apresentam um desempenho ruim em amostras de classes minoritárias (positivas).

Considerando essa limitação, o modelo pode ser formulado em um processo de duas etapas: Primeiro, agrupe amostras de classe majoritária em subgrupos dentro dos quais as amostras de cada subgrupo devem provir de dados completamente diferentes usando o algoritmo k-means no conjunto de dados de treinamento. Segundo, mescle os k subgrupos dos dados da classe majoritária e os dados da classe minoritária, respectivamente, em k subgrupos balanceados para criar um conjunto diversificado.

ANN-2

Entrada: conjunto de dados brutos D, número do centro de agrupamento k

Saída: Integração de algoritmos de aprendizado de redes neurais profundas L

Análise de Rating de Crédito


Avaliar o crédito de uma empresa é tipicamente um assunto muito caro. Geralmente, é necessário que agências como a Standard & Poor(falhou em 2008) ou a Moody's(também falhou em 2008) invistam uma grande quantidade de tempo, esforço e recursos humanos para realizar uma análise completa com base em indicadores financeiros internos, além de métricas estratégicas e operacionais.

Nem todas as empresas podem pagar um investimento tão grande. O objetivo geral da previsão de classificação de crédito é construir modelos que possam extrapolar as observações passadas, fornecendo uma avaliação do risco de crédito a um custo muito menor. Além dessa saída, o próprio processo de modelagem de classificação de títulos também fornece informações valiosas aos usuários.

Um título, majoritariamente é um título de dívida que constitui uma promessa da empresa emissora de pagar uma determinada taxa de juros sobre o preço de emissão original e de resgatar o título pelo valor de face no vencimento. Se uma empresa não conseguir efetuar os pagamentos de juros prometidos, ela ficará inadimplente. 

Ao modelar o risco de crédito, é importante lembrar que alguns dos fatores que determinam a probabilidade de inadimplência são subjetivos. Isso pode incluir a disposição da empresa em pagar ou a capacidade de realizar uma situação difícil. Outros fatores que podem ser importantes são a situação econômica geral, mudanças na gestão, flutuações cambiais, etc.

Obviamente, os dados tradicionalmente usados para uma aproximação de risco de crédito não poderiam abranger todas as informações que normalmente seriam incluídas em um processo como o S & P, portanto o modelo deve capturar os relacionamentos ocultos nos dados de entrada que estão realmente disponíveis. As RNAs capturam esses padrões mais efetivamente do que uma análise discriminante convencional. O uso de um método de interpretação de modelo nos permite capturar essas informações da rede neural para entender melhor os direcionadores de risco de crédito.

A interpretação do modelo também nos permite otimizar ainda mais o algoritmo de propagação de retorno, selecionando conjuntos ótimos de variáveis financeiras de entrada seguindo um procedimento semelhante ao de uma regressão por etapas. Durante esse processo, podemos observar o modelo para quaisquer melhorias na precisão de previsão até que não haja ganhos adicionais de cada etapa de propagação de retrocesso.

Conclusão


As redes neurais são ferramentas valiosas para prever o risco de crédito em situações em que os métodos estatísticos ou de aprendizado de máquina são insuficientes. É importante enfatizar, no entanto, que essas classificações de crédito não devem substituir a análise de um especialista do nível de risco financeiro de uma empresa; em vez disso, eles deveriam servir como um complemento empírico para o processo.

Nenhum comentário:

Tecnologia do Blogger.