Alunos da USP utilizam inteligência artificial para criar ferramentas de análise de textos

Entre os trabalhos desenvolvidos no Instituto de Ciências Matemáticas e de Computação da USP, em São Carlos, estão um sistema que classifica a qualidade de livros, um programa que cria automaticamente resumos de textos jurídicos e outro que detecta conteúdo tóxico de comentários em mídias sociais

 30/07/2024 - Publicado há 4 meses
Projetos foram apresentados a alunos do terceiro ano de curso técnico em informática da cidade de Matão – Foto: Ana Santiago/ICMC

.
Texto: Gabriele Maciel*

Imagine que você deseja comprar um livro e gostaria de conhecer a opinião das pessoas sobre o enredo, os personagens, a escrita e outros aspectos antes de tomar uma decisão. Para atender a essa necessidade, um grupo de alunos do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos, desenvolveu uma ferramenta intitulada L.O.V.E. (Language Over Various Emotion), que oferece uma análise detalhada e precisa da obra a partir desses elementos. O projeto é um dos 11 trabalhos produzidos pelos estudantes durante a disciplina Processamento de Linguagem Natural, ministrada pelo professor Thiago Pardo. 

Todas as propostas de novas tecnologias criadas pelos alunos foram apresentadas em uma feira de inteligência artificial (IA) realizada no dia 27 de junho no instituto. A exposição contou com a participação de alunos e professores do curso Técnico em Informática para Internet da Escola Técnica Estadual (Etec) Sylvio de Mattos Carvalho, da cidade de Matão, em São Paulo. Além do sistema que classifica a qualidade de livros com base em resumos, os adolescentes também conheceram um programa que cria automaticamente resumos de textos jurídicos, outro que detecta conteúdo tóxico de comentários em mídias sociais, entre outros.

O professor Thiago ficou satisfeito em ver o resultado dos conteúdos da disciplina se transformando em projetos de qualidade. Para ele, a experiência de agregar uma atividade de extensão à disciplina, apresentando os trabalhos para a comunidade externa, representou uma oportunidade de desenvolvimento pessoal e técnico para os alunos da USP. “Tinha receio de como fazer essa ideia dar certo, pois os alunos tiveram que explicar seus projetos para o público de forma clara, sem recorrer aos termos técnicos habituais das aulas. Mas, pelo interesse e a avaliação dos visitantes que prestigiaram nossa feira, a proposta foi um sucesso”, afirma o professor.

Um desafio ainda maior enfrentou Laís Piai, mestranda em Linguística da Universidade Federal de São Carlos (UFSCar), que escolheu cursar a disciplina no ICMC como uma oportunidade de complementar sua formação. “Queria aprofundar meu conhecimento na vertente computacional do processamento de linguagem, já que minha linha de pesquisa é em linguagem natural. Foi enriquecedor trocar experiências e aprender com os alunos da área. Participar do desenvolvimento do projeto L.O.V.E. me ajudou a superar o receio que eu tinha dessa parte computacional”, reflete.  

Vanguarda na área de tecnologia

Durante as aulas da disciplina, os alunos aprenderam técnicas computacionais para aplicar na criação de ferramentas voltadas ao reconhecimento de palavras, compreensão da estrutura de frases, descoberta do significado dos textos e desenvolvimento de aplicações práticas. Já para executar os projetos, eles tiveram que adotar duas abordagens: a IA clássica, que utiliza regras definidas por humanos; e a IA moderna, baseada em aprendizado de máquina, como os grandes modelos de linguagem do ChatGPT. Para o professor Thiago, essa experiência permite que os alunos se desenvolvam e saiam da Universidade com os conhecimentos essenciais para se posicionarem no mercado de trabalho. 

“Essa área de IA e de processamento de linguagem natural está explodindo em termos de inovação e oportunidades. A experiência prática de criar e implementar esses projetos prepara os alunos para que estejam na vanguarda de uma das áreas mais dinâmicas e promissoras da tecnologia moderna,” destaca o docente.

Aluno do 8ª semestre do curso de Ciências de Computação, Pedro Nascimento desenvolveu um corretor gramatical similar ao do Word, com uma interface amigável para pessoas digitarem o texto. “Nossa abordagem foi diferente porque tínhamos que apresentar o projeto no evento, então, buscamos desenvolver algo que fosse compreensível para pessoas sem conhecimento técnico. O feedback dos alunos que visitaram a feira foi bastante positivo e motivador,” relata o estudante. Pedro está aprimorando o projeto e pretende, em breve, disponibilizá-lo em código aberto para a comunidade.

Conheça os trabalhos:

  • Análise de sentimentos de avaliações de filmes: a partir de resenhas de filmes, dedica-se à análise de sentimentos em avaliações de filmes, classificando cada texto como positivo ou negativo. 
  • Jogo de perguntas e respostas baseado em textos: traz perguntas e respostas, promovendo a interação de forma a melhorar a compreensão de leitura e interpretação.
  • Sumarização de textos de políticas públicas: a partir de documentos extensos e técnicos, o sistema sumariza textos, facilitando a compreensão e análise por parte de gestores, pesquisadores e do público em geral.
  • Tradução automática: sistema de tradução automática da língua portuguesa para a língua inglesa.
  • Transformando imagens em palavras: programa que gera descrições detalhadas de imagens de forma automática para internet e redes sociais, promovendo a  inclusão de deficientes visuais.
  • Detecção de conteúdo tóxico de comentários em mídias sociais: analisa conteúdos em comentários realizados em diferentes mídias sociais como YouTube e X (antigo Twitter), identificando de maneira automática se são tóxicos. Ao analisar a toxicidade de um comentário ou post, é possível colocar prioridade na análise dos moderadores, ou então bloquear automaticamente o conteúdo. 
  • Esquadrão sintático: o projeto sumariza documentos financeiros longos, como transcrição de conferências de resultados trimestrais, ajudando o usuário a conhecer os resultados de empresas.
  • Sistema de resposta automática a perguntas sobre conjuntos de documentos em língua portuguesa: ferramenta que permite aos usuários obter respostas específicas a partir de uma coleção de documentos em língua portuguesa. O objetivo principal do sistema é facilitar a busca e a recuperação de informações específicas dentro de grandes volumes de texto, tornando o processo de pesquisa mais eficiente e acessível. 
  • Correção gramatical avançada: inspirada no software Grammarly, essa ferramenta de correção gramatical avançada para a língua portuguesa tem como objetivo não apenas corrigir erros gramaticais, mas também melhorar a qualidade geral da escrita. Ela verifica, por exemplo, se o texto está adequado ao estilo identificado e, caso não esteja, sugere opções de reescrita. 
  • Reconhecimento de textos gerados por inteligência artificial: o sistema desenvolvido identifica e diferencia textos gerados por IA daqueles que foram produzidos por humanos, analisando padrões e características distintas de cada grupo. 
  • L.O.V.E. (Language over various emotion): em vez de classificar uma resenha de livro simplesmente como positiva ou negativa, a ferramenta avalia aspectos específicos dos sentimentos dos leitores, destacando o que eles amaram ou odiaram em detalhes.

 

*Da Assessoria de Comunicação do ICMC-USP


Política de uso 
A reprodução de matérias e fotografias é livre mediante a citação do Jornal da USP e do autor. No caso dos arquivos de áudio, deverão constar dos créditos a Rádio USP e, em sendo explicitados, os autores. Para uso de arquivos de vídeo, esses créditos deverão mencionar a TV USP e, caso estejam explicitados, os autores. Fotos devem ser creditadas como USP Imagens e o nome do fotógrafo.