Bases de dados sintéticos não podem ser preconceituosas

Afinal, tudo o que não se quer é que uma inteligência artificial, treinada por essas bases, tenha os mesmos defeitos do homem

A coluna Datacracia desta semana trata dos chamados dados sintéticos, que nada mais são do que um conjunto de dados gerado artificialmente, ou seja, não é coletado. Sua principal função é treinar uma inteligência artificial, fornecendo informações complementares sobre determinados assuntos. “O problema é que essas bases de dados têm muito erro conceitual, muito erro de preconceito mesmo”, diz Luli Radfahrer, citando, como exemplo, a medicina ignorar partes do corpo feminino ou um sistema jurídico mostrar-se racista, homofóbico ou machista.

“Para você treinar uma máquina, tudo o que a gente não quer é que uma inteligência artificial tenha os mesmos defeitos do homem, e ainda amplificados”, avalia o colunista. Por isso, é necessário que a base de dados seja isenta de preconceitos. Por enquanto, esse sistema tem funcionado quando aplicado a certas áreas, e há até quem diga que possa levar a sistemas mais justos. Mas pode igualmente levar a erros sistêmicos, “porque a máquina, vamos lembrar, é um indivíduo sem noção, não sabe o que é certo e o que é errado”.

Acompanhe, pelo link acima, a íntegra do comentário do professor Luli Radfahrer.


Datacracia
A coluna Datacracia, com o professor Luli Radfahrer, vai ao ar toda sexta-feira às 8h30, na Rádio USP (São Paulo 93,7 FM; Ribeirão Preto 107,9 FM) e também no Youtube, com produção do Jornal da USP e TV USP.

.

Política de uso 
A reprodução de matérias e fotografias é livre mediante a citação do Jornal da USP e do autor. No caso dos arquivos de áudio, deverão constar dos créditos a Rádio USP e, em sendo explicitados, os autores. Para uso de arquivos de vídeo, esses créditos deverão mencionar a TV USP e, caso estejam explicitados, os autores. Fotos devem ser creditadas como USP Imagens e o nome do fotógrafo.