TendênciaFOTO: SHUTTERSTOCK

Da fonética forense à inteligência artificial

Reconhecimento de voz e fala envolve pesquisas multidisciplinares

por Eduardo Borba

Nos últimos anos, as constantes investigações de órgãos como Ministério Público e Polícia Federal (PF) sobre atos ilícitos no cenário político-partidário nacional tornaram uma imagem comum em noticiários: dois ou mais personagens, com suas conversas gravadas, nas quais as vozes e o diálogo são objeto de perícia. Apesar do apelo midiático, estudos nesse campo são considerados recentes no Brasil. O conhecimento era restrito à PF, partilhado com suas superintendências e as estruturas de segurança pública de cada Estado.

A fonoaudióloga Cíntia Gonçalves, doutora em Letras pela PUCRS, tem sua tese nesse segmento. Perita criminal do Instituto Geral de Perícias, também é pesquisadora no Laboratório de Áudio e Fonética Acústica (Lafa), uma parceria entre os cursos de Letras, de Engenharia Elétrica e de Matemática da Universidade. “Quando há registro de falas, tem-se a necessidade de comprovação e comparação de locutores, para que se possa afirmar com segurança a identificação obtida. Meu trabalho pretende contribuir na elaboração da prova documental, aferindo determinadas técnicas de procedência e eficiência do áudio investigado, com base em parâmetros que permitam fazer afirmações precisas sobre a autoria da voz/fala”, explica.

MULTIDISCIPLINAR

A orientadora de Cíntia e professora do Programa de Pós-Graduação (PPG) em Letras, Cláudia Brescancini, afirma que esse e os demais trabalhos desenvolvidos no Lafa têm como objetivo mostrar “a área da sociofonética, ramo da linguística que estuda a interface  fonética/sociolinguística, com a descrição das informações sociais presentes na fala natural”, esclarece.

Uma das características da PUCRS nesse tema é a multidisciplinaridade. O Lafa une pesquisadores das áreas de Linguística, de Engenharia, no processamento digital de sinais; e da Matemática, em estatística. O coordenador do Lafa e do Grupo de Pesquisa e Processamento de Áudio, Fonética e Acústica, professor Dênis Fernandes, enfatiza que “o foco é na  identificação do locutor pela voz, ou seja, em quem fala, e não no que fala”. Também é estudado o controle de voz para acesso a ambientes restritos e a verificação com base em suspeitas durante perícias criminais.

A perita Cíntia projeta como próximos passos “pesquisas que identifiquem quais dos parâmetros usados são mais fortes, avançando no grau de precisão e certeza do que é investigado nas evidências de voz/fala natural”.

Projetos para a saúde e o bem-estar

A Informática da PUCRS desenvolve pesquisas em tecnologia tendo como instrumento o  reconhecimento da fala, sua decodificação em textos e recursos de inteligência artificial. Os professores Rafael Bordini e Renata Vieira têm, no momento, orientandos de graduação e de pós-graduação com projetos para saúde e bem-estar. Recentemente foi aprovada a criação do Núcleo de Pesquisa em Inteligência Artificial.

Líder do Grupo de Pesquisa SMART – Semantic, Multi-Agent, and Robotic Technologies, Bordini orienta a mestranda do PPG em Ciência da Computação Debora Engelmann. Ela propõe a interação de um robô com profissionais de hospitais responsáveis por alocar pacientes em leitos.

“Depois de decidir sobre onde acomodar os pacientes, o responsável validaria as escolhas com um robô. Este utilizaria duas técnicas de inteligência artificial: planejamento automático e argumentação. O robô planejador verificaria a consistência da decisão do humano, com base nos prontuários eletrônicos dos pacientes, e ofereceria alternativas, argumentando sobre suas vantagens”, explica o professor.

A outra pesquisa, da doutoranda Juliana Damasio, vislumbra um robô dialogando, no ambiente residencial, com pessoas cegas que vivem sozinhas. Seria um companheiro, ajudando na percepção de riscos nos cômodos da casa e prevenindo acidentes domésticos.

A docente Renata, à frente do Grupo de Processamento da Linguagem Natural, coorienta com a colega Silvia Moraes o trabalho de conclusão de Bruno Moreira. Ele estuda o uso da voz para jogos com narrativas, como Role-Playing Game, auxiliando cegos neste entretenimento. “A narrativa seria lida para o jogador, oferecendo opções, e este responderia por voz. A fala, depois de convertida em escrita, poderá ser enriquecida de sinônimos para as respostas, usando inteligência artificial e ampliando o sentido do que foi dito. O foco é a interpretação do que é dito”, ressalta a pesquisadora. Para ela, há 23 anos neste campo, esta “é uma área com bastante espaço ainda, sendo preciso trabalhar melhor com a semântica e as interpretações, que são ambíguas e dependem de contexto” projeta.