Humanidades digitais oferecem novas possibilidades de pesquisa

De repositórios a experiências em realidade aumentada, pesquisas na área de humanidades digitais têm aumentado mas exigem apoio tecnológico e infraestrutura computacional

 Publicado: 21/11/2024 às 22:20

Texto: Carolina Borin

Foto: Divulgação/Projetos MAP e Demonumenta

Um software capaz de armazenar mais de dois milhões de textos, um modelo de catalogação capaz de registrar memórias de atores sociais marginalizados na história e uma experiência de realidade aumentada com modelos 3D de monumentos e questões sobre o patrimônio histórico. Essas são algumas possibilidades de pesquisa na área das Humanidades Digitais, campo de estudo recente no país, que avança em iniciativas de centros de pesquisas e universidades como a USP. 

Ainda que a definição do termo esteja em debate na comunidade acadêmica, ele pode ser entendido como aquele que designa uma transdisciplina e uma comunidade de prática. Isto é, um conjunto de pesquisadores que utilizam de uma abordagem de estudo e de pesquisa que articulam dispositivos e perspectivas das ciências humanas e sociais, ao mesmo tempo em que mobiliza as ferramentas e perspectivas singulares abertas pela tecnologia digital.

A proposta de unir as ferramentas digitais e os conhecimentos da área da computação e tecnologia com as humanidades, no entanto, é anterior ao uso do termo “Humanidades Digitais”, que remonta aos anos 2000, como explica Pedro Telles, professor do departamento de História da Faculdade de Filosofia, Letras e Ciências Humanas (FFLCH) da USP. Antes, o conceito que definia essas pesquisas era Humanities Computing, ou, em português, Humanidades Computacionais. Nesse caso, o computador era central e havia um foco na pesquisa da área das linguagens. Um dos primeiros trabalhos realizados foi a indexação dos textos de Tomás de Aquino por Roberto Busa e Thomas J. Watson, o Index Thomisticus de Roberto Busa, disponibilizado em 2005 para consulta.

Nos anos 2000, com o advento da internet e a ampliação dos seus usos, as Humanidades Digitais expandiram a ideia inicial de serem apenas aplicações da área computacional e de ferramentas nas humanidades, para se configurarem como uma comunidade transdisciplinar que propõe reflexões críticas sobre como os recentes avanços tecnológicos possibilitam novos caminhos para a pesquisa em humanidades. 

Para além da questão técnica, a perspectiva das humanidades são indissociáveis e importantes para pensar o campo de estudo. “O grande debate é como incorporar essas tecnologias digitais de maneira que as especificidades de cada área não sejam reduzidas ao uso do computador”, afirma Telles. 

Foto: Arquivo pessoal

Pedro Telles, professor da FFLCH - Foto: Arquivo pessoal

“Existe uma preocupação muito característica das humanidades com o aspecto crítico que é importante para que as Humanidades Digitais não recaiam nem em uma tecnofilia, nem em uma alienação de mercado sobre essas tecnologias”, complementa Ricardo Pimenta, pesquisador do Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT) do Ministério da Ciência, Tecnologia, Inovação e Comunicações (MCTIC) e professor da pós-graduação em Ciência da Informação da Universidade Federal do Rio de Janeiro (UFRJ). 

Se por um lado, os recursos digitais promovem maior acesso e ampliam a capacidade de armazenamento, por outro, eles externalizam o registro da memória em suportes de informação, sejam eles escritos, sejam eles em computadores, HD ou armazenamento em nuvem. 

“Ao mesmo tempo que expandem o potencial de preservação e manutenção da memória, também podem colaborar com uma alienação e perda do controle caso não seja feita a manutenção dessa memória – como é feito em arquivos públicos e acervos – , em um cenário que a atualização e a obsolescência programada dessas tecnologias são cada vez mais frequentes”, avalia Pimenta. “Discutir a memória nessa área é fundamental. Pensar o que é e de que forma precisa ser preservado e futuramente recuperado, não é só um projeto de presente, como também um projeto futuro e essencialmente político”.

Monumentos, seres híbridos e questões coloniais

Exposição Botannica Tirannica que usa inteligência artificial - Foto: Julia Thompson/Museu Judaico

Um dos exemplos de trabalho na área de humanidades digitais envolve arquitetura e artes, desenvolvido pela professora, artista e curadora Giselle Beiguelman, da Faculdade de Arquitetura e Urbanismo e de Design (FAU) da USP. Junto a alunos de graduação e pós-graduação dos cursos de Arquitetura e Design, em parceria com o Instituto de Matemática e Estatística (IME) e o Museu Paulista, ambos da USP, ela criou em 2022 o projeto demonumentaRA

Trata-se de uma experiência de realidade aumentada em que o participante utiliza um aplicativo original e gratuito, com audioguias, para acessar modelos 3D de monumentos da cidade, que foram, em sua grande maioria, inaugurados durante datas comemorativas da história brasileira. O objetivo é discutir a colonialidade do patrimônio histórico e acervos públicos da cidade a partir da observação e reflexão sobre 22 monumentos.

A construção de métodos para reunir acervos e documentos no ambiente digital também está em andamento desde 2023 no projeto Acervos Digitais e Pesquisa: arte, arquitetura e design. “Estamos desenvolvendo uma série de métodos de catalogação com visão computacional, extração de dados e combinação de informação diante da possibilidade de desenvolver imagens para memórias que nunca foram documentadas em imagens ou em textos mobilizando testemunhos e outras formas de fazer história”, conta a professora.

A exposição Botannica Tirannica utilizou a inteligência artificial para gerar imagens de seres híbridos, uma mistura de vegetais, animais e minerais, que questionam princípios coloniais. O trabalho surgiu a partir do contato da pesquisadora com a espécie Tradescantia zebrina, popularmente conhecida como “judeu-errante”. A nomenclatura instigou Giselle a pesquisar como a botânica, assim como em outras áreas, preconceitos e violências simbólicas, sobretudo, nos nomes das espécies são perpetuados. Por meio desse recurso tecnológico, a pesquisadora propôs outros nomes e imagens possíveis. “A Inteligência Artificial tem uma potência, essa inteligência das máquinas – que não é superior nem substitui a inteligência dos homens – podem relativizar a nossa percepção de mundo”, afirma.

Giselle Beiguelman – Foto: Marcos Santos/USP Imagens

Giselle Beiguelman - Foto: Marcos Santos/USP Imagens

Mais recentemente, em abril de 2024, a professora elaborou o projeto Venenosas, nocivas e suspeitas, que utiliza modelos de produção de imagens a partir de textos ou outras bases visuais por meio da inteligência artificial para retomar espécies de plantas que ao mesmo tempo foram proibidas pelo processo “civilizador” colonial usadas em rituais sagrados; e hoje em dia são retomadas pela indústria farmacêutica. As imagens usadas tem como referência mulheres naturalistas dos séculos 17 a 19. 

Ilustração do aplicativo para smartphone desenvolvido para a exposição demonumentaRA - Fotos: Divulgação / demonumenta FAU USP​

Ainda que a inteligência artificial seja o principal recurso utilizado nos dois projetos, esse mecanismo também impõe alguns desafios como a censura do algoritmo pelo fato das plantas selecionadas terem palavras e termos sensíveis, referentes a gênero, raça, religião e com plantas relacionadas a drogas e substâncias proibidas. “Para driblar essas situações, desenvolvi uma série de expedientes táticos, como usar terminologia científica e nomes latinos, e assim conseguir introduzir nos sistemas espécies com nomes preconceituosos e seres andróginos”, ressalta Giselle. 

Acervos digitais e novas vozes

Registro de 1822 escrito por uma mulher em documento do projeto Mulheres na América Potuguesa (MAP) - Foto: Divulgação/MAP

O projeto Mulheres na América Portuguesa (MAP) é um dos trabalhos do Laboratório Virtual de Humanidades Digitais (LaViHD) da Faculdade de Filosofia, Letras e Ciências Humanas (FFLCH) da USP, que busca desenvolver ambientes de apoio e ferramentas para acervos digitais e eletrônicos – principalmente para captura imagética de documentos, edição filológica e anotação linguística. 

O laboratório faz parte do Núcleo de Apoio à Pesquisa em Etimologia e História da Língua Portuguesa (NEHiLP) e surgiu do Grupo de Pesquisas Humanidades Digitais, primeiro da área a ser registrado no Diretório de Grupos de Pesquisa do Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) em 2011. O grupo construiu e administrou entre 2008 e 2013 a primeira plataforma da Biblioteca Brasiliana Digital.

Desde 2017, o projeto MAP faz o mapeamento de documentos escritos por mulheres na América Portuguesa, a partir de cartas escritas de próprio punho, materiais escritos por terceiros falando sobre essas mulheres ou documentos escritos que falem sobre mulheres, processos inquisitoriais e requerimentos de mulheres negras forras – que receberam a carta de alforrias que eram re-escravizadas ou tinham seus filhos re-escravizados, sempre considerando o período de 1500 a 1822.

“É muito raro ter um documento escrito por mulher que tenha sido preservado, e as cartas de próprio punho são ainda mais raras considerando os índices de alfabetização da época. São documentos interessantes e a partir de uma carta presente no conjunto de documentos que pesquisei no doutorado surgiu a ideia do MAP”, conta Vanessa Martins do Monte, professora, pesquisadora da FFLCH e coordenadora do MAP. O objetivo do projeto é a construção de um catálogo digital, que reúna essa documentação e possibilite que as vozes dessas mulheres presentes nas fontes primárias tornem-se autorais, narradoras de suas próprias histórias.

Vanessa Martins do Monte - Foto: Marcos Santos/Jornal da USP

Vanessa Martins do Monte, pesquisadora da FFLCH - Foto: Marcos Santos/Jornal da USP

“É um ótimo exemplo de pesquisa na área de humanidades digitais já que estamos propondo um olhar que reúne esses documentos no meio digital para quem quiser consultar”, reforça Maria Clara Paixão, também professora no Departamento de Letras Clássicas e Vernáculas da FFLCH e coordenadora do projeto. “É um caminho de mão dupla porque ao mesmo tempo que recebemos muito do meio digital, também podemos dar produtos e pesquisas como retorno, para a comunidade acadêmica e também para a sociedade”, complementa.

Equipe do Laboratório Virtual de Humanidades Digitais da FFLCH no projeto Mulheres na América Portuguesa - Foto: Divulgação/MAP

Outro projeto, o Carolina – Corpus Aberto para Linguística e Inteligência Artificial, é um projeto de Big Data com cerca de 830 milhões de palavras e 2 milhões de textos, o que equivaleria a 13 toneladas de papel impresso. Com o apoio do Centro de Inteligência Artificial (C4AI) da USP, é um conjunto de dados coletados para pesquisa linguística construído como parte do projeto Natural Language Processing for Portuguese – NLP2 (Processamento de linguagem natural para o Português). Inclui textos do âmbito judiciário e legislativo brasileiros, obras literárias em domínio público, textos jornalísticos, textos de redes sociais e wikis, e documentos já publicados em outros corpora.

Disponível em acesso aberto, para download gratuito, o corpus Carolina considera textos existentes no meio digital, produzidos entre 1970 e 2021, com informações de procedência e tipologia (tipo) para construir uma base para outras tecnologias, inteligências artificiais, como chat bots, formularem textos em português brasileiro. “Selecionamos os melhores textos para fazer um conjunto balanceado, em termos de tipologia e gênero, garantindo que esses eles tenham qualidade, sejam íntegros e possam gerar modelos representativos da língua escrita”, explica a professora Maria Clara.

“No Brasil nós temos uma língua de muitos recursos e uma população imensa que está na internet, produzindo muitos textos e, por isso, temos muitos dados”, complementa Vanessa, destacando que essa realidade não é a mesma de outras variações do português, como o de Portugal. 

Maria Clara Paixão, pesquisadora da FFLCH - Foto: Divulgação/Arquivo pessoal

Maria Clara Paixão, pesquisadora da FFLCH - Foto: Divulgação/Arquivo pessoal

A iniciativa conta com uma equipe multidisciplinar de linguistas e cientistas da computação, incluindo pesquisadores do Instituto de Matemática e Estatística (IME) e do Instituto de Ciências Matemáticas e da Computação (ICMC), ambos da USP. 

Linguística computacional e relatos médicos

Na área de linguística computacional, outro projeto tem pesquisado conteúdos de prontuários médicos para aprimorar registros e possíveis associações entre os relatos, exames e diagnóstico. Trata-se do Modelos Linguístico-Computacionais para Análise da Semântica Latente de Entrevistas Clínicas, liderado pelos professores Marcos Lopes, do Departamento de Linguística da FFLCH e do curso de especialização em Inteligência Artificial da Escola Politécnica (Poli) da USP, e Alfredo José Mansur, diretor clínico do Instituto do Coração (InCor).

Pela possibilidade de ser aplicada sobre qualquer língua natural, a análise linguística tem aplicações bastante variadas. “A análise computacional representa uma das possibilidades da análise linguística em geral. Não é exatamente nova nem muito menos a única, tem recursos e limitações próprias e vem ganhando muita visibilidade nos últimos anos”, explica Lopes.

Nesse projeto, os pesquisadores buscam aplicar, avaliar e comparar métodos de processamento computacional de língua natural para analisar dados de entrevistas clínicas registrados nos prontuários eletrônicos de hospitais, em formato textual bruto, sem formatação nem estruturação dos relatos dos pacientes.

“Esses projetos lidam com conjuntos de dados em formato digital e implicam, também, o desenvolvimento de programas originais criados pela equipe de pesquisa para análise dos dados“, comenta o professor.

Marcos Lopes, professor de Linguística da FFLCH - Foto: Arquivo pessoal

Marcos Lopes, professor de Linguística da FFLCH - Foto: Arquivo pessoal

Desafios da área

Apesar do aumento crescente das pesquisas em Humanidades Digitais, existem desafios e dilemas a ser enfrentados, de acordo com os pesquisadores da área. Um deles é o uso de língua estrangeira, principalmente o inglês, na maioria das ferramentas. “A maior parte de diretórios e grupos de Humanidades Digitais usam softwares e ferramentas em língua inglesa”, destaca Pimenta. 

Para ajudar nesta questão, o Laboratório em Rede de Humanidades Digitais (Larhud) do IBICT, coordenado por ele, criou o projeto Wiki Larhud, uma enciclopédia alimentada pelos pesquisadores do laboratório com indicações de ferramentas em língua portuguesa que podem usadas em projetos. O laboratório também desenvolveu o TADiRAH, Taxonomia sobre Atividades Digitais de Pesquisa nas Humanidades, junto do Centro Argentino de Información Científica y Tecnológica (CAICYT). Nesse segundo projeto, a proposta foi criar um software capaz de armazenar um vocabulário comum com os termos utilizados nas Humanidades Digitais.

Proposta semelhante foi desenvolvida pelo Hímaco (História, Mapas e Computadores), grupo de pesquisa vinculado ao Laboratório de Humanidades Digitais (lab.hum), da Universidade Federal de São Paulo (Unifesp), coordenado pelo professor Luis Ferla, doutor em história pela USP. O grupo participou da tradução de comandos e tutoriais do Programming Historian, que é um um repositório de dados abertos de métodos em Humanidades Digitais

A questão do financiamento e da infraestrutura é outro desafio para os pesquisadores da área. Para a pesquisadora Maria Clara Paixão, da FFLCH, as instituições de ensino superior e pesquisa precisam entender que as áreas das humanidades digitais precisam ter apoio da infraestrutura computacional. “Nós somos muito cobrados para fazer pesquisas inovadoras, mas essa cobrança não pode existir sem que exista apoio tecnológico”.

“O cenário de exclusão digital no país não justifica a falta de incentivo e a compreensão desse fenômeno, que é a sociedade em rede e o mundo digital e suas relações”, destaca George Leonardo Coelho, professor da Universidade Federal do Tocantins (UFT) e coordenador do MITECHIS, grupo de pesquisa em Mídias, Tecnologias e História. “É necessário investimento público, laboratórios, computadores, hardwares e cursos de formação para os jovens pesquisadores das instituições de ensino de todas as regiões do país”, conclui o professor.


Política de uso 
A reprodução de matérias e fotografias é livre mediante a citação do Jornal da USP e do autor. No caso dos arquivos de áudio, deverão constar dos créditos a Rádio USP e, em sendo explicitados, os autores. Para uso de arquivos de vídeo, esses créditos deverão mencionar a TV USP e, caso estejam explicitados, os autores. Fotos devem ser creditadas como USP Imagens e o nome do fotógrafo.