Temas Prioritários

Extração de Conhecimento de Grandes Volumes de Dados

Projeto de Cooperação 2

Coordenador: Luiz Gustavo Fernandes

theme3-project2 A extração de conhecimento a partir de grandes quantidades de dados tornou-se imprescindível em um mundo onde coleta-se dados relacionados a praticamente qualquer aspecto da vida cotidiana de forma incessante. O conjunto de técnicas empregadas para a extração de conhecimento permite, por exemplo, percepções que extrapolam análises mais superficiais de conjuntos de dados volumosos, complexos e que não tenham sido necessariamente coletados para este fim.

Os principais desafios de pesquisa na área tratam:

(i) da escalabilidade de algoritmos aptos a processarem grandes volumes de dados;

(ii) da confiabilidade de tais sistemas escaláveis;

(iii) da habilidade de visualizar estes dados de forma a permitir percepções compreensíveis para humanos; e

(iv) do uso de técnicas de computação paralela para o processamento destes dados em tempo real. Este projeto visa impulsionar colaborações internacionais para aprimorar o estado-da-arte para cada um dos desafios acima através de parcerias estratégicas com renomadas universidades que contam com laboratórios de pesquisa reconhecidos nestas temáticas. Na colaboração com a Universidade de Pisa (Itália) pretende-se investigar técnicas de paralelização aliadas a algoritmos de computação adaptativa e autônoma para melhorar a eficiência do processo de análise de grandes volumes de dados em tempo real.

A colaboração com a Universidade de Lugano (Suíça) busca desenvolver novas abordagens para melhorar a escalabilidade e a confiabilidade de sistemas distribuídos através do uso de técnicas de State Machine Replication (SMR). Este tópico visa o desenvolvimento de protocolos para dar suporte a sistemas distribuídos na presença de comportamento arbitrário ou malicioso dos processos computacionais. Por fim, com Universidade de Dalhousie (Canadá) a parceria explora dois temas. O primeiro compreende o desenvolvimento de novas técnicas de visualização para destacar aspectos chave de conjuntos de dados durante qualquer processo de análise, com foco na fase de préprocessamento. O segundo tema visa o desenvolvimento de técnicas inteligência artificial para reconhecimento de metas para o comportamento humano a partir do emprego de grandes volumes de dados do mundo real sem a necessidade de envolvimento de um especialista humano para o propor o modelo de reconhecimento de planos.

Veja outros projetos do tema 3

Avanços da Genômica e Biodiversidade

Projeto de Cooperação 1

Mundo Interconectado

Projeto de Cooperação 3

Tecnologia, Energia e Recursos Naturais

Projeto de Cooperação 4