Denise Casatti/Assessoria de Comunicação do ICMC
Pesquisadores da USP de diversas áreas do conhecimento estão sendo desafiados a criar uma ferramenta capaz de reconhecer automaticamente variações na voz, para detecção de doenças como a covid-19. Eles fazem parte do projeto Sistema de Detecção Precoce de Insuficiência Respiratória por meio de Análise de Áudio (SPIRA), que utiliza um sistema de Inteligência Artificial para comparar vozes de pessoas infectadas pelo novo coronavírus com as de indivíduos saudáveis.
Para desenvolvimento do sistema, os pesquisadores precisaram ensinar ao computador a identificar características da voz de uma pessoa saudável em contraposição com a de alguém afetado por uma síndrome respiratória. Para coletar as variações de vozes, disponibilizaram um site para doações voluntárias. A dificuldade maior estava na obtenção das vozes dos pacientes diagnosticados com covid-19, explica Marcelo Finger, professor do Instituto de Matemática e Estatística (IME) da USP e coordenador do projeto. “Para obter as gravações, precisávamos de profissionais da área de saúde capacitados, treinados e que tivessem autorização para transitar pela enfermaria de um hospital que estivesse tratando de pacientes infectados pelo novo coronavírus”, diz.
Mesmo com tantas dificuldades, foram coletadas vozes de aproximadamente 200 pacientes de dois hospitais parceiros do projeto, o Hospital das Clínicas (HC) da Faculdade de Medicina da USP (FMUSP) e o Hospital Universitário (HU) da USP. Coletadas as vozes, os áudios foram enviados a uma base de dados que, automaticamente, realizou a primeira triagem do material.
Excesso de sons e ruídos
Com os dados em mãos, os pesquisadores tiveram outros desafios como a separação das vozes sobrepostas nas gravações: as dos profissionais de saúde e as dos pacientes, que muitas vezes precisavam de ajuda para ler as frases recomendadas pelo sistema. Foi preciso desenvolver uma ferramenta de Inteligência Artificial baseada em redes neurais artificiais, para separação das vozes, diz a professora Sandra Aluísio, que coordena trabalhos da equipe do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP.
Essa parte do projeto ficou sob a responsabilidade de Edresson Casanova, orientando de Sandra. “A análise do áudio bruto é muito custosa e complexa, mesmo para as técnicas mais avançadas de Inteligência Artificial. Em vez de treinar uma rede neural artificial com os dados brutos de áudio, que possibilitariam uma taxa menor de sucesso, tentamos usar alternativas baseadas em extrações de características e padrões contidos nesses arquivos”, diz Edresson.
O caminho encontrado pelo doutorando consistiu em tornar a voz visível para o computador. Assim, ele conseguiu empregar técnicas de visualização computacional, que já foram amplamente testadas e estão disponíveis para separar as vozes. Depois, foi só voltar a transformar a imagem (que agora representa apenas uma voz) em áudio novamente. Esse método de separação está, atualmente, sendo testado a partir de um banco com mil horas de vozes em inglês, que permitiu separar vozes sobrepostas.
Acesse abaixo a live do Ciência USP, com o professor Marcelo Finger e outros pesquisadores, sobre Inteligência Artificial e reconhecimento de vozes:
Conhecimento em construção
“Esse é um projeto de pesquisa com risco porque pode não dar certo. De repente, não vamos conseguir criar uma ferramenta que consiga identificar sinais de insuficiência respiratória com uma precisão aceitável”, pondera Finger. De qualquer forma, os pesquisadores sabem que as descobertas que surgirem durante a jornada têm potencial para, futuramente, serem aplicadas em inúmeros outros campos como, por exemplo, na criação de sistemas de reconhecimento automático de voz para o português e no aprimoramento de assistentes virtuais.
Os estudos realizados por esse grupo multidisciplinar fazem parte de uma ampla área de pesquisa em Inteligência Artificial que está em franca expansão no mundo: o processamento de linguagem natural. “Estamos abrindo uma frente na pesquisa sobre o emprego da voz para fazer diagnóstico de problemas variados. Inicialmente, estudamos a insuficiência pulmonar por causa do contexto em que vivemos. Mas há outras doenças que podem se manifestar pela voz, como alterações nas pregas vocais, problemas cardíacos, pressão alta e ataques de ansiedade”, explica Finger.
Pesquisadores de diversas áreas participam do projeto SPIRA: da Faculdade de Medicina (FM) da USP, do Instituto de Matemática e Estatística (IME) da USP, do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, da Universidade Tecnológica Federal do Paranám (UTFPR), e da Faculdade de Filosofia, Letras e Ciências Humana (FFLCH) da USP.