Sistema utiliza “vida artificial” para encontrar padrões em Big Data

Metodologia inspirada no conceito de vida artificial é capaz de reconhecer padrões em Big Data – Fotomontagem Moisés Dorado

.
Os avanços tecnológicos que todos presenciamos têm gerados gigantescos volumes de dados conhecidos como Big Data. Extrair informações e conhecimento deles acaba se tornando algo tão complexo a ponto de não poder ser “gerenciado” por métodos de processamento de dados convencionais. No Instituto de Física de São Carlos (IFSC) da USP, cientistas conseguiram desenvolver uma nova metodologia capaz de reconhecer padrões em Big Data, modelado como redes complexas, inspirando-se no conceito de vida artificial.

O Life-like Network Automata — ou simplesmente LLNA — é o nome do novo sistema de inteligência artificial que pode ser aplicado, por exemplo, na análise de diversas relações (sociais, biológicas, matemáticas, etc.), bem como no reconhecimento de autoria de texto. O LLNA é, segundo os pesquisadores, um método superior aos demais utilizados no reconhecimento de padrões em Big Data usando redes. Isso porque, para extrair padrões em Big Data, o método proposto modela dados — sejam eles imagens, textos, áudios, vídeos, equações, códigos, etc. — em redes que representam as relações entre as informações e faz com que gerações de seres artificiais vivam nessas redes e encontrem padrões ali. Em um artigo publicado na Scientific Reports, da Nature, o professor Odemir Martinez Bruno e as doutorandas Gisele Helena Barboni Miranda e Jeaneth Machicao, do Grupo de Computação Interdisciplinar do IFSC, associaram o uso de redes complexas com os autômatos celulares — modelos matemáticos, ou “seres artificiais” —, para simular diferentes interações, como, por exemplo, reações químicas em seres vivos ou o contato entre pessoas nas redes sociais.

Jeaneth Machicao e Odemir Bruno – Foto: Divulgação IFSC

As redes são hábitats para a vida artificial. Ao final de centenas de gerações, a forma como estes “seres artificiais” se adaptam ao meio virtual revela peculiaridades das redes e, desta forma, os padrões são identificados. “O autômato celular vem de uma teoria matemática”, explica o professor Martinez Bruno. “Trata-se de um programa de computador que modela seres que interagem com o meio, simulando vida”.

Alan Turing, criador do computador moderno, introduziu esse conceito no século 20, por meio da Teoria dos Autômatos, que consiste na criação de uma representação de seres virtuais que seguem regras específicas para interagir com o meio ambiente, como se fossem seres biológicos. “Inspirados nas células dos organismos vivos, uma célula nasce, cresce, se reproduz e morre, e interage com outras células num determinado ambiente. O autômato celular tem uma vida artificial”, descreve a doutoranda Jeaneth Machicao.

Aplicações práticas

Até pouco tempo atrás, os cientistas podiam separar informações importantes usando um modelo clássico de reducionismo, extraindo as informações que interferem de modo substancial no objeto de estudo e obtendo um modelo minimalista de dados relevantes. Contudo, há muitos experimentos na ciência moderna em que esse modelo clássico não é aplicável, sobretudo pela quantidade enorme de informações que pode haver. “Existem vários exemplos disso, e o mais clássico na ciência é a previsão meteorológica, que fez surgir a Teoria do Caos [que propõe que um simples fenômeno pode dar origem a consequências imprevisíveis]. Como vou usar um modelo minimalista para predizer se choverá na próxima semana, em um determinado local, por exemplo? Tem muitos agentes envolvidos nesse tipo de fenômeno, e é por isso que precisamos utilizar outras matemáticas para estudá-los”, explica o professor.

No trabalho publicado, os cientistas testaram o novo método em dados matemáticos teóricos e em dados reais. No primeiro estudo de caso com dados reais, o LLNA conseguiu extrair padrões que permitem distinguir entre organismos vivos a partir das redes metabólicas, formadas por todas as reações químicas que ocorrem nos seres vivos. Nesse contexto, os cientistas analisaram as redes metabólicas de três grupos de seres vivos: Archaea, Bacteria e Eukarya.

Os mecanismos de interação que permitem que usuários se relacionem no Google Plus e no Twitter foram modelados, de modo que o LLNA pudesse reconhecer quais mecanismos correspondiam ao de cada site. Embora a metodologia tenha diferenciado e reconhecido as redes de interação de ambas as redes sociais, resta agora compreender quais são as características — os padrões — que as tornam tão distintas. Entre as hipóteses, os pesquisadores destacam a interface e a proposta desses sites.

Além delas, os pesquisadores analisaram padrões em redes extraídas a partir de imagens de estômatos, pequenas aberturas através das quais as plantas respiram. No último caso, observaram que a posição dos estômatos se altera na superfície das plantas à medida que crescem expostas a diferentes tempos de exposição à luz solar, o que permitiria saber, por exemplo, a quantidade de horas em que uma planta recebeu luz.

Reconhecimento de autoria de texto

Em colaboração com o Instituto de Ciências Matemáticas e de Computação (ICMC), também da USP, com o professor Diego Amancio e seu orientado de doutorado Edilson Corrêa Júnior, os pesquisadores do IFSC realizaram outro trabalho, descrevendo o uso do LLNA no reconhecimento de autoria de texto.

Os cientistas usaram correlações entre as palavras de obras literárias de oito autores (Arthur Conan Doyle, Bram Stoker, Charles Darwin, Charles Dickens, Thomas Hardy, Pelham Grenville Wodehouse, Edgar Allan Poe e Alice Munro), tendo-as introduzido em uma rede complexa e, enfim, extraído características que permitiram que o LLNA reconhecesse, com cerca de 70% de precisão, quem era o autor de cada livro analisado, distinguindo as diferenças que há entre as escritas.

A possibilidade de aplicação da técnica é imensa. Jeaneth Machicao explica que o uso do novo sistema também poderia ser utilizado na área de segurança cibernética.

Em uma investigação forense, por exemplo, o LLNA poderia ajudar a descobrir se uma mensagem eletrônica, peça-chave em uma suposta investigação criminal, teria sido escrita pela pessoa cujo nome estivesse na assinatura do e-mail.

Segundo o professor Bruno, o LLNA poderia ser aplicado também em recomendações de vendas. Com base na análise do comportamento de um usuário na Internet, seria possível encontrar padrões que sugerissem um produto no qual a pessoa estivesse interessada em adquirir. Há diversos outros exemplos de aplicações do LLNA, inclusive na área médica, em que se poderia identificar uma doença de modo precoce, a partir de um grande volume de dados gerados por exames médicos de um paciente.

Desde o final de 2016, a doutoranda Gisele Miranda tem desenvolvido parte de seu doutorado na Universidade de Gent, na Bélgica, onde há pesquisadores parceiros do IFSC. O intuito da doutoranda é apresentar a técnica do LLNA aos cientistas belgas, de modo que estes possam desenvolver novos trabalhos em conjunto com o grupo brasileiro.

Com informações de Rui Sintra e Thierry Santos – Assessoria de Comunicação – IFSC

Mais informações: e-mail bruno@ifsc.usp.br

PODCASTS

11 3091-3300 11 3091-3220 imprensa@usp.br

Rádio USP São Paulo | 93,7 FM (11) 3091-4425 - Rua do Matão, 1578 - Cidade Universitária São Paulo/SP - Brasil - CEP 05508-090

Rádio USP Ribeirão Preto | 107,9 FM (16) 3315-3525 - Av. Bandeirantes, 3900 Ribeirão Preto/SP - Brasil - CEP 14040-900

Aplicações práticas

Reconhecimento de autoria de texto

Talvez você goste também

\\ BUSCA

\\ PODCASTS

\\ ARTIGOS

\\ MAIS LIDAS

EDITORIAS

EDIÇÃO REGIONAL

11 3091-3300
11 3091-3220
imprensa@usp.br

Rádio USP São Paulo | 93,7 FM
(11) 3091-4425 - Rua do Matão, 1578 - Cidade Universitária
São Paulo/SP - Brasil - CEP 05508-090

Rádio USP Ribeirão Preto | 107,9 FM
(16) 3315-3525 - Av. Bandeirantes, 3900
Ribeirão Preto/SP - Brasil - CEP 14040-900