Extração de Conhecimento de Grandes Volumes da Dados

Projeto de Cooperação 2

Coordenador: Luiz Gustavo Fernandes

theme3-project2A extração de conhecimento a partir de grandes quantidades de dados tornou-se imprescindível em um mundo onde coleta-se dados relacionados a praticamente qualquer aspecto da vida cotidiana de forma incessante. O conjunto de técnicas empregadas para a extração de conhecimento permite, por exemplo, percepções que extrapolam análises mais superficiais de conjuntos de dados volumosos, complexos e que não tenham sido necessariamente coletados para este fim.

Os principais desafios de pesquisa na área tratam:

(i) da escalabilidade de algoritmos aptos a processarem grandes volumes de dados;

(ii) da confiabilidade de tais sistemas escaláveis;

(iii) da habilidade de visualizar estes dados de forma a permitir percepções compreensíveis para humanos; e

(iv) do uso de técnicas de computação paralela para o processamento destes dados em tempo real. Este projeto visa impulsionar colaborações internacionais para aprimorar o estado-da-arte para cada um dos desafios acima através de parcerias estratégicas com renomadas universidades que contam com laboratórios de pesquisa reconhecidos nestas temáticas. Na colaboração com a Universidade de Pisa (Itália) pretende-se investigar técnicas de paralelização aliadas a algoritmos de computação adaptativa e autônoma para melhorar a eficiência do processo de análise de grandes volumes de dados em tempo real.

A colaboração com a Universidade de Lugano (Suíça) busca desenvolver novas abordagens para melhorar a escalabilidade e a confiabilidade de sistemas distribuídos através do uso de técnicas de State Machine Replication (SMR). Este tópico visa o desenvolvimento de protocolos para dar suporte a sistemas distribuídos na presença de comportamento arbitrário ou malicioso dos processos computacionais. Por fim, com Universidade Carnegie Mellon (EUA) a parceria explora dois temas. O primeiro compreende o desenvolvimento de novas técnicas de visualização para destacar aspectos chave de conjuntos de dados durante qualquer processo de análise, com foco na fase de préprocessamento. O segundo tema visa o desenvolvimento de técnicas inteligência artificial para reconhecimento de metas para o comportamento humano a partir do emprego de grandes volumes de dados do mundo real sem a necessidade de envolvimento de um especialista humano para o propor o modelo de reconhecimento de planos.


EQUIPE PUCRS

Duncan Dubugras Alcoba Ruiz ORCID ID
Felipe Rech Meneguzzi ORCID ID
Fernando Luís Dotti ORCID ID
Isabel Harb Manssour ORCID ID
Luiz Gustavo Leão Fernandes ORCID ID
Milene Selbach Silveira ORCID ID
Roberto Tietzmann ORCID ID
Rodrigo Coelho Barros ORCID ID
Tiago Coelho Ferreto ORCID ID

Veja outros projetos do tema 3