angle-left Aluno da Unifor desenvolve tese sobre análise de dados e ganha destaque internacional

Seg, 24 Setembro 2018 15:37

Aluno da Unifor desenvolve tese sobre análise de dados e ganha destaque internacional

Doutor em Informática Aplicada pela Unifor, Henrique Oliveira realizou pesquisa que utiliza a linguagem do usuário nos indicadores para análise de dados.


Henrique Oliveira Santos ganhou destaque internacional com sua pesquisa. Foto: Divulgação.
Henrique Oliveira Santos ganhou destaque internacional com sua pesquisa. Foto: Divulgação.

Henrique Oliveira Santos, doutor em Informática Aplicada pela Universidade de Fortaleza (Unifor), desenvolveu como tese a pesquisa “Uma Abordagem baseada em Indicadores para Alinhamento de Variáveis através de Grafos de Conhecimento", em inglês "An Indicator-based Approach for Variable Alignment based on Knowledge Graphs". 

O estudo, que tem como objetivo central facilitar a análise de dados científicos, foi apresentado em inglês, já que a banca avaliadora estava fisicamente separada, parte em Fortaleza (Unifor) e outra nos EUA. A tese foi orientada pelo professor Vasco Furtado, diretor de Pesquisa, Desenvolvimento e Inovação da Unifor, e teve como co-orientador o professor Paulo Pinheiro (pesquisador do Rensselaer Polytechnic Institute). 

O trabalho descreve o resultado de uma análise de dados utilizando a linguagem dos usuários, em outras palavras, é possível estabelecer uma ligação entre o viés técnico e uma compreensão mais didática. “Minha pesquisa foca nessa ponte, onde representamos o domínio dos dados (seja ele saúde, ambiental, cidades etc.) e indicadores definidos pelos usuários, caracterizando conjuntos de dados brutos e permitindo a geração automática de visualizações baseadas em indicadores que traduzem as necessidades de análise dos usuários”, explica Henrique Oliveira.

A pesquisa pode ser aplicada em várias organizações que conduzem projetos suportados por dados e que necessitam obter visualizações de forma rápida e calculadas a um alto grau de confiança. “Instituições diferentes, compartilham de um problema em comum: utilizam conjuntos de dados brutos que eram difíceis de interpretar, mesclar e analisar. Com isso, iniciei um trabalho de caracterizar semanticamente diversos conjuntos de dados, facilitando o entendimento dos usuários de seu conteúdo”, afirma o pesquisador. 

Henrique conta ainda que após o processo, com os dados já caracterizados e de fácil acessibilidade, o intuito do trabalho se volta para a utilização de indicadores a fim de promover a análise de dados, se tornando a principal contribuição de sua tese. Cerca de 80% do tempo gasto para realizar a análise é gasto apenas com a preparação, assim, ele identificou a oportunidade de reduzir esse tempo o que, consequentemente, auxilia nos projetos guiados a terem mais velocidade, alcançando seus objetivos. 

Publicações Internacionais

Também Mestre em Informática Aplicada pela Universidade de Fortaleza (Unifor) e atualmente Engenheiro de Software no Rensselaer Polytechnic Institute (RPI) em Troy, NY - EUA, Henrique Oliveira teve sua pesquisa divulgada em publicações de impacto internacional. 

Em 2015, dois artigos relativos à representação do conhecimento adotado por ele foram publicados em workshops de abordagens semânticas para Cidades Inteligentes e Dados Científicos. Esses workshops fizeram parte da International Semantic Web Conference (ISWC 2015) em Bethlehem, PA - EUA, a mais importante conferência em web semântica. 

Em 2017,  um outro artigo foi publicado na Extended Semantic Web Conference (ESWC 2017) em Portorož, Eslovênia, que é considerada a segunda maior conferência em web semântica (ESWC e ISWC ambas são conceito A1 - o nível mais alto - no ranking da CAPES). O artigo já demonstrava parte do processo de análise de dados proposto pela minha tese e como o utilizamos para construir visualizações automáticas a partir de dados brutos e da definição de indicadores no contexto de cidades inteligentes. 

Ainda em 2017, foi apresentada uma versão resumida da proposta de tese no Consórcio Doutoral da ISWC 2017 em Viena, Áustria. 

“Boa parte da implementação que realizei em suporte a minha tese foi aproveitada para o desenvolvimento do HADatAc (Human-Aware Data Acquisition Framework) que é um ambiente para harmonização de dados científicos. Atualmente ele é utilizado pelo RPI e Yale University nos EUA, e pela Unifor e UFMG no Brasil em suporte a projetos orientados a dados”, ressalta Henrique.