É amplamente aceito que incerteza é indesejável na tomada de decisões e pode ser prejudicial para os resultados das decisões em muitas indústrias. No entanto, todos os dias as empresas precisam lidar com a incerteza sobre os acontecimentos futuros, como, por exemplo, o clima, a política, o ambiente, a legislação, a economia, o comércio exterior e assuntos legais, a tecnologia, os mercados, entre outros aspectos. Um termo usado para descrever técnicas recentemente desenvolvidas para lidar com a incerteza é "modelagem preditiva", que é "o processo de desenvolvimento de uma ferramenta ou modelo matemático que gera uma previsão precisa". Fazer previsões utilizando ferramentas associadas à aprendizagem automática não é apenas uma tendência visível, mas é também uma forma promissora de lidar com a incerteza sobre eventos futuros.
Para muitos fins práticos, a aprendizagem automática é um método de análise de dados que automatiza a construção de modelos analíticos. É um ramo da inteligência artificial baseada na ideia de que sistemas podem aprender com dados, identificar padrões e tomar decisões com uma intervenção humana mínima.
No entanto, tem havido críticas sobre tais abordagens. Considerando o "flash crash" (queda instantânea) da NYSE em 6 de maio de 2010 e a crise subprime que ocorreu em 2008, vários analistas afirmam que tais modelos não conseguiram incorporar a capacidade humana quase interminável de se comportar irracionalmente, que não pode ser facilmente reduzida a uma equação algorítmica. Todavia, uma justificação semelhante também está nos fundamentos da teoria dos conjuntos difusos em 1965. Precisamente, a motivação para o desenvolvimento da teoria dos conjuntos difusos foi a percepção de que as técnicas tradicionais de análise do sistema não tinham sido eficazes. Os pioneiros dos conjuntos difusos tiveram o objetivo de desenvolver a capacidade de modelar a imprecisão e a incerteza do mundo real, bem como a heurística de resolver os problemas que os humanos usam informalmente todos os dias.
Relatamos aqui a experiência de modelagem da Unidade de Pesquisa de Economia e Análise de Negócios no contexto de avaliar o risco de crédito. Desenvolvemos e exploramos um processo com dois estágios para analisar o crédito dos consumidores, que inclui ambas as técnicas, resultando no que chamamos de abordagem fuzzy-neural. Prever a credibilidade dos consumidores é um esforço impreciso e ambíguo. O nosso trabalho incluiu a pontuação de crédito e a classificação padrão, avaliando a ameaça de falência do consumidor. Nosso conjunto de dados é composto por quase 9.500 clientes de uma operadora de cartão de crédito brasileiro com 19 variáveis.
Uma das variáveis é se o cliente não cumpriu previamente com uma obrigação financeira. Cinco das variáveis são classificações de pontuação fornecidas por agências privadas de pontuação de crédito ao consumidor. As variáveis restantes referem-se a dados demográficos, informações financeiras e outras informações para cada cliente. Uma pontuação fuzzy (difusa) é gerada e aplicada como entrada para "treinar" uma rede neural visando classificar clientes em grupos que potencialmente seriam inadimplentes ou não inadimplentes. O nosso objetivo é explorar as diferenças de desempenho entre: (i) um modelo de rede neural contendo dados difusos (fuzzy) e (ii) vários modelos de redes neurais, cada um deles contendo (ou não) uma variável de classificação de mercado (e.g. Serasa, Fico, Transunion, etc.) para diferentes demografias.
Uma das contribuições mais relevantes deste estudo, no entanto, é o desenvolvimento do que consideramos uma abordagem inovadora para a pontuação de crédito. Este é um processo em dois estágios que envolve o uso de um modelo de inferência difusa como entrada para o modelo de rede neural (o que chamamos de abordagem fuzzy-neural), usando classificações de pontuação de crédito comercialmente disponíveis como resposta para conduzir o passo de raciocínio difuso da análise. A principal conclusão da nossa investigação é que, em geral, nosso método fuzzy-neural teve melhores resultados do que a aplicação pura de algum método de classificação de pontuação disponível no mercado como dados de entrada, uma vez que foi capaz de reduzir a incerteza, melhorando a previsibilidade e reduzindo a variabilidade dos resultados quando comparado a um modelo sem pontuação de mercado.
O desempenho de uma combinação de um método fuzzy e neural foi muito satisfatório; a imprecisão geralmente presente nas informações do banco de dados de uma empresa foi, em certa medida, incorporada pelo nosso método com bons resultados. Do ponto de vista prático, demonstramos que é possível que as empresas desenvolvam mecanismos de classificação de crédito internamente com base em dados anteriores, utilizando sistemas de inferência difusa. Sob determinadas circunstâncias, as companhias podem considerar esta opção preferível do que a opção usual de pagar taxas elevadas às agências grandes de pontuação de crédito para usar seus sistemas proprietários.
Nosso método poderia também servir como um bom indicativo simples da saúde financeira dos clientes uma vez que aparentemente era capaz de discriminar mais claramente do que outros resultados em termos de avaliação financeira e diferenciação de clientes insolventes dos solventes. Além disso, o desenvolvimento de nosso método envolveu uma análise pura e simples dos dados existentes (exceto pelo uso de uma pontuação benchmark), sendo uma solução potencialmente viável e certamente mais barata do que as classificações de pontuação fornecidas pelas agências de classificação comercial. Finalmente, porque usa uma lógica difusa, nosso método também é capaz de incorporar contribuições de profissionais especialistas em termos de raciocínio humano ou heurística, sempre que aplicável ou desejado.
*Peter F. Wanke é Ph.D. , Coordenador do Business Analytics and Economics Research Unit (BAE RU), Professor do COPPEAD/UFRJ e Coordenador do Programa de Doutorado em Adminsitração de Empresas. Joint Appointment Professor - EBAPE / FGV. Editor associado dos periódicos Socio-Economic Planning Sciences (Elsevier), Tourism Economics (SAGE), International Journal of Islamic and Middle Eastern Finance and Management (Emerald) e da Revista Brasileira de Transportes (FGV). Ele figura ainda no ranking do Journal PLOS Biology dos cientistas mais influentes do mundo e recebeu o prêmio de Outstanding Researcher pela IEOM - Industrial Engineering and Operations Management – Society.