Pesquisadores da Unifor realizam estudos sobre o uso da inteligência artificial nas áreas financeira, jurídica e da saúde

ter, 12 setembro 2023 18:07

Pesquisadores da Unifor realizam estudos sobre o uso da inteligência artificial nas áreas financeira, jurídica e da saúde

As pesquisas são desenvolvidas no âmbito do Laboratório de Ciência de Dados e Inteligência Artificial (LCDIA) da instituição

Atualmente, a Unifor possui 23 projetos de pesquisa na área de IA, desenvolvidos por 20 professores e 73 alunos (Foto: Getty Images)

A inteligência artificial (IA) está cada vez mais presente no dia a dia da população, contribuindo para a otimização de inúmeros processos nas mais diversas áreas da vida prática. Portanto, se faz necessário o desenvolvimento constante de pesquisas visando ampliar a aplicabilidade do recurso. Acompanhando esse movimento, a Universidade de Fortaleza - instituição mantida pela Fundação Edson Queiroz - investe constantemente em projetos de inovação na área. As pesquisas são desenvolvidas no âmbito do Laboratório de Ciência de Dados e Inteligência Artificial (LCDIA) da Universidade, coordenado pelo professor Vasco Furtado.

Segundo Furtado, no LCDIA, o grupo de pesquisadores desenvolve pesquisas práticas com empresas públicas e privadas fomentando a inovação empresarial através das pesquisas realizadas. “Alguns desses trabalhos já estão sendo usados por empresas levando a maior produtividade e qualidade na prestação de serviços”, acrescenta.

Entre as mais de 20 pesquisas com o uso de IA desenvolvidas na Unifor, cinco produções científicas desenvolvidas por alunos e docentes do Programa de Pós-Graduação em Informática Aplicada (PPGIA) da Unifor serão apresentadas na 12ª Conferência Brasileira de Sistemas Inteligentes - BRACIS 2023, um dos eventos mais importantes no Brasil para pesquisadores interessados em publicar resultados significativos e inovadores em Inteligência Artificial (IA) e Inteligência Computacional (IC). O evento acontece de 25 e 29 de setembro no campus da Universidade Federal de Minas Gerais (UFMG), em Belo Horizonte.

Compõem a programação do BRACIS 2023 também o 20º Encontro Nacional de Inteligência Artificial e Computacional (ENIAC) e o 14º Simpósio de Tecnologia da Informação e da Linguagem Humana (STIL). Entre os artigos que serão apresentados nos eventos científicos, dois abordam o uso de IA na área jurídica, um sobre a aplicabilidade na área da saúde e dois acerca do uso da ferramenta no mercado financeiro.

“Ter cinco artigos aceitos no principal evento de Inteligência Artificial do País mostra a força do grupo de pesquisa da Unifor” - Vasco Furtado, professor pesquisador e coordenador do LCDIA

Saiba mais sobre as pesquisas abaixo.

Sobre o LCDIA

O Laboratório de Ciência de Dados e Inteligência Artificial (NCDIA) da Universidade de Fortaleza é um ambiente dedicado ao desenvolvimento de projetos de pesquisa e inovação através da análise de dados, da excelência de modelos matemáticos, estatísticos e computacionais, e da aplicação e aprimoramento de técnicas de inteligência artificial, utilizando processamento de linguagem natural, aprendizado de máquina e aprendizado profundo. Entre as áreas de atuação estão:

Ciência de Dados;
Mineração de Processos;
Inteligência Artificial;
Redes Complexas.

Sobre o BRACIS

O BRACIS teve origem da combinação dos dois eventos científicos mais importantes no Brasil em Inteligência Artificial (IA) e Inteligência Computacional (IC): o Simpósio Brasileiro de Inteligência Artificial - SBIA (22 edições) e o Simpósio Brasileiro de Redes Neurais - SBRN (13 edições). Realizado anualmente pela Sociedade Brasileira de Computação (SBC) com apoio de grupos de interesse especial em Inteligência Artificial (CEIA) e Inteligência Computacional (CEIC), neste ano, a conferência está sendo organizada pelo Centro de Inovação em Inteligência Artificial para a Saúde (CIIA-Saúde). O evento promove tanto aspectos teóricos quanto aplicações de Inteligência Artificial e Inteligência Computacional, bem como incentiva a troca de ideias científicas entre pesquisadores, profissionais, cientistas e indústria.

CDJUR-BR - Uma Coleção Dourada do Judiciário Brasileiro com Entidades Nomeadas Refinadas

No artigo, os pesquisadores relataram o processo de anotação manual de documentos legais com vistas a criar uma coleção de entidades nomeadas padrão ouro, intitulada de CDJURBR. O objetivo principal da pesquisa era preencher a lacuna existente de recursos linguísticos, disponibilizando um conjunto de dados que possa contribuir para o desenvolvimento de novos modelos de aprendizado de máquina na esfera do judiciário em língua portuguesa.

Na publicação, foram descritos os critérios de seleção dos corpora utilizados, os treinamentos dos anotadores, as métricas de aferição da concordância entre os anotadores, a etapa de revisão das anotações e os resultados dos experimentos com modelos de reconhecimento de entidades nomeadas.

Os resultados apontaram superioridade do modelo BERT (Bidirectional Encoder Representations from Transformers/ Representações de Codificadores Bidirecionais dos Transformadores) com a Média Macro F1 geral de 0,58, demonstrando a viabilidade da CDJURBR para o treinamento de sistemas Reconhecimento de Entidades Nomeadas (REN). Todavia, os pesquisadores perceberam que as características dos dados impactam consideravelmente no desempenho dos modelos. Isso sugere melhorias para aumentar o conjunto de dados para balancear as amostras das diversas Entidades Nomeadas, reduzindo o impacto dos dados nos modelos REN.

A pesquisa contou com a colaboração dos alunos dos PPGIA Maurício Brito e Francisco das Chagas Jucá Bomfim, do docente do curso de Direito da Unifor João Araújo Monteiro Neto, dos pesquisadores do LCIA Vládia Pinheiro, Vasco Furtado e André Câmara Ferreira da Costa e da professora do IFCE Raquel Silveira.

Aproveitando a arrecadação de imposto sobre a propriedade por meio de um modelo não supervisionado para qualificação do contribuinte

O trabalho propõe um modelo de Machine Learning (aprendizado de máquina) não supervisionado para qualificar os contribuintes de impostos imobiliários como o Imposto Predial e Territorial Urbano (IPTU), tributo de competência municipal e importante suporte financeiro de serviços públicos, a partir do histórico de pagamentos e dos débitos do imposto. Os principais objetivos do modelo é otimizar o envio de notificações, comunicações e cartas de cobrança e aumentar a eficiência na arrecadação de impostos, na medida em que fornece uma análise mais precisa dos padrões de pagamento e evita a seleção manual e ad-hoc de bons ou maus pagadores.

Foi desenvolvido um sistema de Régua de Cobrança do IPTU para o ano de 2023 na cidade de Fortaleza. Foram utilizados dados históricos de pagamentos do IPTU nos anos de 2018 a 2022 e realizada uma análise comparativa com o modelo baseline, usado na Secretaria Municipal das Finanças de Fortaleza (Sefin) para a cobrança do IPTU em 2022. Os experimentos realizados demonstraram um desempenho promissor do modelo treinado. Com a abordagem de seleção de bons pagadores para envio da primeira carta com a notificação e lançamento do IPTU, o modelo obteve F1-Score de 92,30% e um aumento estimado da arrecadação da ordem de R$ 75 milhões.

A pesquisa foi realizada pelos alunos do Programa de Pós-Graduação em Informática Aplicada (PPGIA), Elioenai Alves e Fabio Santos, por Luiz Zairo Bastos Viana (aluno) e Wellington Franco (professor), ambos da Universidade Federal do Ceará (campus Crateús), e pela coordenadora do PPGIA da Unifor, Vládia Pinheiro.

Previsão de casos de doenças infecciosas com base na intensidade de contágio a nível de bairro: Estudo de caso para a Dengue

O artigo mostra como modelos preditivos baseados em redes neurais (LSTM - Long Short Term Memory/ Memória Longa de Curto Prazo) podem ter melhor acurácia na tarefa de prever casos de dengue por bairro, bem como identificar regiões mais suscetíveis à epidemia. O estudo sugere o uso de modelos que incorporem informações heurísticas que capturem a intensidade de propagação da doença normalizada pela população. Os modelos baseados em LSTM, com e sem a heurística proposta, foram avaliados quanto à capacidade de prever os casos para toda a cidade bem como para todos os bairros. Foi obtida uma melhoria ao se usar tal estratégia. Para a pesquisa foram utilizados dados de casos de dengue da cidade de Fortaleza dos anos de 2007 a 2020 totalizando 222.817 casos.

A publicação é de autoria dos pesquisadores do Laboratório de Ciência de Dados e Inteligência Artificial (LCDIA) da Unifor, Rafael Bomfim, J. L. B. de Araújo e Vasco Furtado, com o médico epidemiologista e pesquisador Antônio Silva Lima Neto (Dr. Tanta), atual Secretário Executivo de Vigilância em Saúde do Estado do Ceará. A pesquisa foi desenvolvida em parceria com a Prefeitura Municipal de Fortaleza, por meio da Secretaria Municipal de Saúde (SMS).

Segundo o professor do curso de Ciência da Computação da Unifor, Rafael Bonfim, doutor em Informática Aplicada com foco em aprendizado de máquina, com essas pesquisas, eles esperam que a comunidade acadêmica possa avançar na compreensão de transmissão de casos de dengue.

“Esperamos também disponibilizar cada vez mais modelos preditivos com maior nível de acurácia para permitir que o poder público possa antecipar aumentos repentinos de casos de dengue a tempo de mitigar problemas futuros ou até mesmo barrar a transmissão” - Rafael Bonfim, doutor em Informática Aplicada e professor da Universidade de Fortaleza

LegalBert-pt: Um modelo de linguagem pré-treinado para o domínio jurídico do português brasileiro

O artigo afirma que apesar de modelos de linguagem treinados com Representações de Encoder Bidirecionais de Transformadores (BERT) demonstrarem resultados notáveis em várias tarefas de Processamento de Linguagem Natural (PLN), o domínio jurídico apresenta desafios específicos para o PLN devido ao seu idioma altamente especializado, que inclui vocabulário técnico, estilo formal, uso frequente de citações de leis e semântica baseada em vasto conhecimento. Nesse sentido, o trabalho descreve o desenvolvimento de um modelo de linguagem especializado, LegalBert-pt, para o domínio jurídico em português.

O modelo foi pré-treinado em um corpus grande e diversificado de textos jurídicos brasileiros e agora é de código aberto e personalizável para tarefas específicas. Foram conduzidos experimentos para avaliar a eficácia do modelo pré-treinado no domínio jurídico, tanto intrinsecamente quanto em duas tarefas específicas: reconhecimento de entidades nomeadas e classificação de texto. Os resultados indicaram que o uso do LegalBert-pt supera o modelo de linguagem genérico em todas as tarefas, destacando a importância da especialização para alcançar resultados eficazes para tarefas específicas no domínio jurídico.

A publicação é de autoria dos pesquisadores da Unifor Vládia Pinheiro, Vasco Furtado, Caio Ponte e Vitor Almeida, e da professora do Instituto Federal de Educação, Ciência e Tecnologia (IFCE), Raquel Silveira. A pesquisa foi desenvolvida com base em documentos legais do Tribunal de Justiça do Estado do Ceará (TJ-CE), do Ministério Público do Estado do Ceará (MP-CE) e de Recursos Extraordinários do Superior Tribunal Federal (STF).

Extração de informações das demonstrações financeiras com base em modelos de documentos visualmente ricos

O artigo apresenta um sistema de extração de informação para documentos financeiros visualmente ricos. O sistema utiliza modelos neurais pré-treinados da família LayoutXLM e os refina para uso em demonstrações financeiras. Duas etapas de pós-processamento foram desenvolvidas com o intuito de ajustar os resultados gerados pelo modelo refinado. A partir de avaliações empíricas comparativas, os pesquisadores concluíram que o sistema proposto é eficaz na extração de informações de documentos financeiros e oferece potencial para automatizar e otimizar o processo de análise e validação de demonstrações financeiras.

Desenvolvida com a KPMG, uma das maiores empresas de prestação de serviços profissionais, que incluem auditoria, impostos e consultoria financeira e empresarial, a pesquisa tem como autores os alunos do PPGIA, Elioenai Alves, Cecília Carvalho, Patrick Martins e os docentes e pesquisadores do LCDIA, Vládia Pinheiro e Vasco Furtado.