Blog
Inteligência Artificial aplicada às Finanças
07/02/2018O campo das técnicas de exploração e análise estatística de dados conhecido sob a denominação genérica machine learning (aprendizado de máquinas) sofreu em anos recentes uma rápida expansão e demonstrou eficácia na solução de problemas de alta complexidade envolvendo grandes volumes de dados, até menos de uma década atrás considerados não manejáveis computacionalmente. Em particular, o emprego de redes de neurônios artificiais de múltiplas camadas (deep neural networks) logrou, ao longo dos últimos cinco anos, resolver na prática o problema da classificação (rotulação) automática de imagens com taxas de acerto superiores ao desempenho humano. Êxitos semelhantes foram obtidos nas áreas de reconhecimento de fala e processamento de linguagens naturais.
Redes neurais profundas operam por treinamento em uma rica base de dados rotulados, sofrendo as etapas de um aprendizado pelo exemplo. Por tentativa e erro, uma rede em treinamento ajusta gradativamente seu (grande) conjunto de parâmetros internos, até que se obtenha um sistema que responda corretamente ao problema de classificação ou regressão proposto, dentro de uma tolerância especificada. Os ajustes intermediários são baseados no erro em cada tentativa e os atributos dos dados que revelam as feições mais importantes são “descobertos” pela própria rede. Os parâmetros obtidos ao final do processo constituem o modelo em si, que é capaz de generalizar as análises para dados inteiramente novos, não presentes no conjunto de treinamento.
Considerando os grandes volumes de dados quantitativos e a alta qualidade e acurácia dos registros históricos, poucas áreas se mostram mais naturalmente adequadas ao emprego de ferramentas de inteligência artificial do que o domínio das finanças. Em consequência, assiste-se a um crescente número de casos de uso de machine learning neste campo, tendência cotejada pelo crescimento do acesso universal a computadores mais potentes e a ferramentas de software eficazes e gratuitas ou de baixo custo.
Nos dias correntes, técnicas de inteligência artificial começam a assumir um papel integrador em inúmeras tarefas do ecossistema financeiro, tais como aprovação de crédito, gerenciamento de ativos e avaliação de riscos.
No âmbito da gestão de ativos, algumas tendências de popularidade crescente são o uso de inteligência artificial no gerenciamento de portfólios com metas de investimento e risco pré-estabelecidas, o emprego de algoritmos inteligentes para automação de tradings de curto período e a análise automática de notícias na área de finanças para produzir previsões baseadas no caráter otimista ou pessimista dos textos (sentiment analysis). Embora as tecnologias envolvidas sejam na maior parte dos casos proprietárias e mantidas sob sigilo pelas agências, a tendência da pesquisa acadêmica aponta para o uso crescente de redes neurais profundas aplicadas a séries de cotações nos dois primeiros casos e para o emprego de ferramentas de processamento de linguagem natural no último caso.
Quanto às tecnologias disponíveis, há um ambiente favorável à disseminação de ferramentas básicas de machine learning de baixo custo ou gratuitas, embora detalhes de implementação possam ser mantidas em segredo por desenvolvedores específicos. Dentre as ferramentas de código aberto e de uso mais difundido, merecem destaque:
- - TensorFlow™: Desenvolvido pelo Google
Brain Team para conduzir pesquisas em machine
learning e redes neurais profundas, é uma biblioteca para computação
numérica usando estruturas em forma de nós conectados (grafos), capaz de gerenciar massivos fluxos de dados em
arquiteturas flexíveis e complexas.
- - Keras: Interface de alto nível em linguagem Python para construção e operação de redes neurais, capaz de trabalhar sobre TensorFlow™ e permitindo grande produtividade, enfatizando a rápida experimentação sobre diferentes arquiteturas.
- - SciKit-Learn: Conjunto de ferramentas em linguagem Python simples e eficientes para mineração e análise de dados, prontas para uso em tarefas de pré-processamento, classificação, regressão, agrupamento, redução de dimensionalidade, visualização de dados e seleção de modelos.
- - Knime: Plataforma visual para construção de fluxos de operações sobre matrizes de dados, incluindo ferramentas de machine learning.
O uso dessas ferramentas em sinergia é bastante viável, potencializando seu alcance e poder preditivo. Um traço comum de todas estas técnicas é sua natureza estatística: quanto maiores e mais diversificados forem os volumes de dados fornecidos como insumo, maior a probabilidade de sucesso das ferramentas. Por exemplo, em 2015 uma rede neural profunda desenvolvida pela Microsoft (ResNet) vence uma competição internacional de reconhecimento de imagens (ImageNet Large-Scale Visual Recognition Challenge), obtendo uma taxa de acerto superior a 96% (humanos desempenham entre 90 e 95%), após ser treinada com dezenas de milhões de exemplos.
O emprego de dados complementares aos das séries históricas de cotações, tais como balanços trimestrais e indicadores marginais baseados em dados textuais e a incorporação sistemática de expertise humana são portanto medidas desejáveis para o enriquecimento dos modelos de predição.
INFORMAÇÕES COMPLEMENTARES:
- Um panorama dos tópicos de machine learning pode ser encontrado em: https://goo.gl/ansn6V
- Um histórico dos progressos em reconhecimento de imagens via Deep Learning está em: https://goo.gl/QQMU7i
- Uma exposição não-técnica sobre os potenciais usos de inteligência artificial no campo das finanças se encontra em: https://goo.gl/LKpeQ3
- Um exemplo de estudo acadêmico sobre redes neurais profundas aplicadas a séries de cotações pode ser lido em: https://goo.gl/GE4fzC
Antônio de Pádua Pires é Doutor
em Meteorologia pela Université Paul Sabatier, Toulouse, França e Mestre em
Física pela Universidade Federal do Ceará. Trabalha atualmente na
Petrobras como geofísico de exploração na área de tecnologia geológica.