Muito antes dos portugueses chegarem ao Brasil, em 1500, os povos indígenas já habitavam nossas terras. Os europeus, no entanto, além de explorarem as áreas brasileiras, também interferiram nos costumes e hábitos de quem já residia por aqui. Em meio a tantas mudanças culturais, mais de dois terços das línguas indígenas foram se perdendo ao longo do caminho, ao passo que nos dias de hoje muitas delas estão cada vez mais enfraquecidas.
Para ajudar a mudar esse cenário, um projeto conjunto da USP, por meio do Centro de Inteligência Artificial (C4AI) e da IBM Research, tem como objetivo empregar as tecnologias de Inteligência Artificial (IA) no fortalecimento de línguas indígenas brasileiras. A iniciativa pretende criar e desenvolver ferramentas que auxiliem a documentação, preservação, vitalização e uso desses idiomas, sempre em parceria com as comunidades de povos indígenas. De acordo com os pesquisadores envolvidos, os primeiros protótipos de pesquisa poderão ser testados no segundo semestre de 2023.
Por meio da área de Processamento de Linguagem Natural (PLN), a IA poderá ajudar, por exemplo, na construção de sistemas de conversão de fala para texto e vice-versa, no desenvolvimento de ferramentas de tradução e expansão de vocabulário, na melhoria de programas de coleta e análise linguística, além de outros avanços tecnológicos que podem ser aplicados para a preservação das línguas nativas. A criação de teclados e completadores de texto para línguas indígenas, bem como o uso de computadores e robôs na educação de crianças e jovens das comunidades, também serão explorados no projeto.
“Nós vamos atuar, principalmente, em duas frentes. Uma delas é a de vitalizar, ou seja, aumentar a quantidade de jovens que falam e escrevem essas línguas. Já a segunda é voltada para fortalecer as línguas indígenas que já se encontram em um processo de desaparecimento, por isso estamos buscando formas de documentá-las para que elas sejam mantidas para a posteridade. Há línguas, por exemplo, que possuem apenas três únicos falantes, de 70 anos de idade. Mas o fundamental é estar sempre trabalhando com as comunidades indígenas e com especialistas no assunto”, explica o vice-diretor do C4AI, Claudio Pinhanez, um dos líderes do projeto junto com a professora Luciana Storto, da Faculdade de Filosofia, Letras e Ciências Humanas (FFLCH) da USP.
Adaptar tecnologias
O trabalho em desenvolvimento no Centro de Inteligência Artificial da USP é dividido por áreas de interesse. Em cada uma delas, a IA é empregada de uma maneira específica, sempre visando ao fortalecimento e ao uso das línguas indígenas. Os pesquisadores buscam adaptar as tecnologias de IA para estas línguas, criar ferramentas de apoio ao trabalho linguístico – por exemplo, sistemas de transcrição fonética, tradução automática, análise gramatical e criação de dicionários digitais –, além de utilizar essas línguas nas redes sociais e em conjunto com chatbots voltados para a educação dos povos indígenas – um esforço pioneiro.
Pinhanez explica que, hoje, não existem tradutores de línguas indígenas para o português brasileiro. “Se você colocar no ChatGPT, por exemplo, ele inventa do nada uma língua. Ele apresenta diversas palavras que parecem, mas que não são indígenas. O que estamos elaborando é uma construção conjunta, mostrando aos povos indígenas o que podemos fazer e ouvindo o que eles querem e precisam. Dentro de tantas dificuldades, foram eles que nos procuraram e trouxeram as demandas existentes. Segundo os líderes das comunidades, a maior preocupação são os jovens, que estão crescendo sem sequer saber a própria língua, incluindo a capacidade de escrever. Mostramos o que pode ser tentado e o que podemos criar. Se isso irá resolver, aí é outra questão. O que já vimos até aqui é um retorno muito bom da comunidade com que estamos trabalhando, eles estão gostando do que está sendo proposto e direcionando o trabalho de acordo com suas necessidades. É um processo. A tecnologia tem que se adaptar ao mundo deles e eles têm que aprender sobre a tecnologia”, afirmou.
Parceria
Atualmente, o projeto tem uma parceria com escolas da Terra Indígena Tenonde Porã, no sul da cidade de São Paulo. Embora as crianças e jovens da comunidade falem fluentemente a língua guarani mbya, eles ainda apresentam dificuldades em aplicar sua parte escrita. Nesse sentido, o projeto prevê oficinas semanais com os estudantes e professores do ensino médio para que ferramentas de escrita e de documentação linguística sejam exploradas e desenvolvidas de forma conjunta. “Estamos felizes com as oficinas que vêm sendo desenvolvidas. Esses momentos têm sido importantes para pensarmos como as ferramentas tecnológicas podem nos ajudar a valorizar nossa língua materna, por meio do apoio ao desenvolvimento da escrita, nossos conhecimentos e práticas. Além disso, temos refletido sobre os processos de tradução e a importância dos usos dessas ferramentas como instrumento político de fortalecimento dos nossos modos de viver”, afirma a liderança da Terra Indígena Tenonde Porã. As ferramentas estão sendo codesenvolvidas com os alunos e professores da escola e usadas em aula de uma forma experimental.
Outro objetivo do projeto é viabilizar a formação e o desenvolvimento contínuos das comunidades pelos seus próprios membros, permitindo que eles aprendam e ensinem conteúdos de informática, programação, IA e linguística, além de atuarem em rede com profissionais interessados em contribuir para a vitalidade das línguas indígenas.
A iniciativa do C4AI e IBM é importante porque a maioria das línguas indígenas no Brasil e no mundo está ameaçada de desaparecer até o final do século 21. Além de enfrentar a invasão territorial, a disseminação de doenças e a destruição de ecossistemas, os povos indígenas sofrem com a imposição de línguas europeias, a educação não diferenciada e a intensificação das relações com o mundo dos não indígenas. A transformação digital com a internet, celulares, jogos on-line e mídias sociais tem desestimulado muitos indígenas, especialmente crianças e jovens, a falar e conhecer suas línguas originárias no cotidiano.
Nesse sentido, a IA pode ser vista como uma aliada desses povos na preservação e continuidade de suas culturas. Com o uso das novas tecnologias, é possível confrontar os desafios e ameaças que as línguas indígenas enfrentam e garantir sua continuidade para as gerações futuras.
A equipe envolvida no projeto é formada atualmente por cerca de 20 pessoas, sendo elas pesquisadores, professores, alunos bolsistas, profissionais técnicos e estagiários. O projeto conta também com um bolsista de pós-doutorado, quatro bolsistas de graduação e um bolsista para auxílio técnico, apoiados por um projeto de pesquisa do C4AI, que conta com apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp). Além disso, por parte da IBM Research, participam um engenheiro de software, um doutorando e dois estagiários de graduação.
A iniciativa segue na busca ativa por professores, profissionais, estudantes e alunos indígenas que tenham interesse em integrar a equipe. Além disso, a ideia é que o projeto conte com indígenas que atuem como professores (em todos os níveis), linguistas, programadores e profissionais de TI e tradutores. O C4AI e a IBM estão abertos a novas parcerias e demandas para ampliar a gama de atuação dessa importante frente de trabalho.
Confira, abaixo, a lista principal de pesquisadores envolvidos no projeto:
Claudio Pinhanez (investigador principal) – IBM Research Brasil
Luciana Storto (investigadora principal) – FFLCH-USP
Alexander Yao Cobbinah – FFLCH-USP
Majoi Gongora – FFLCH-USP
Marisa Vasconcelos – IBM Research Brasil
Paulo Cavalin – IBM Research Brasil
Sarajane Marques Peres – EACH-USP
Thomas Finbow – FFLCH-USP
Por Fabrício Santos e Henrique Fontes, da Assessoria de Comunicação do C4AI/USP
Mais informações: (16) 99727-2257