.
Entre os dias 29 de julho e 9 de agosto deste ano, o Instituto de Matemática e Estatística (IME) da Universidade organiza a Escola São Paulo de Ciência Avançada em Aprendizagem de Dados. A iniciativa tem financiamento de um programa da Fapesp, a Fundação de Amparo à Pesquisa do Estado de São Paulo, de aproximadamente R$ 800 mil, segundo o professor João Eduardo Ferreira, do Departamento de Ciências da Computação do IME. Ele é o coordenador do evento, que será realizado no Centro de Difusão Internacional (CDI) da USP, em São Paulo.
Segundo o pesquisador, que responde atualmente pela Superintendência de Tecnologia da Informação (STI) da USP, o programa oferecerá, por intermédio de dez cursos avançados e palestras convidadas, uma visão integrada e fundamentos, tecnologias e aplicações em Ciência de Dados para pesquisadores, pós-doutorandos e estudantes de pós-graduação. “Ao todo serão dez pesquisadores e cinco palestrantes que irão compor o programa da Escola”, informa o docente, destacando a participação, entre outros, do professor Yaser Said Abu-Mustafá, da Engenharia Elétrica e Ciência da Computação do California Institute of Technology – Caltech, nos Estados Unidos. “Já temos mais de 670 inscrições do Brasil e do exterior”, comemora o professor, explicando que a Escola concederá 100 bolsas de estudo para os participantes selecionados, que receberão apoio para transporte, taxas de inscrição, hospedagem e refeições durante todo o evento.
Conhecimentos essenciais
Com a organização do curso, o IME demonstra sua capacidade para auxiliar na implementação e organização de projetos em Ciência de Dados (Data Science), não apenas na USP, mas em instituições de estudos e pesquisas de todo o Estado. “Temos uma vocação natural para atuarmos na área, já que em nossos quatro departamentos estudamos fundamentos de matemática, ciência da computação, probabilidade e estatística, todos conhecimentos essenciais para o desenvolvimento da Ciência de Dados”, descreve o professor Júnior Barrera, diretor do IME.
Segundo Barrera, o IME hospeda, atualmente, diversos projetos relacionados à área de Ciência de Dados, como o Centro de Pesquisa, Inovação e Difusão (Cepid) Neuromat e o INCT das Cidades Inteligentes, além de dez projetos temáticos da Fapesp. “E vale lembrar que, há muitos anos, o Centro de Estatística Aplicada aqui do instituto atua na solução de problemas estatísticos aplicados”, ressalta Barrera. Ele lembra ainda o Programa Interunidades de Bioinformática, que congrega oito unidades da USP: Instituto de Biociências (IB), Instituto de Ciências Biomédicas (ICB), Instituto de Química (IQ), Escola Superior de Agricultura Luiz de Queiroz (Esalq), em Piracicaba, Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto (FFCLRP), Instituto de Física de São Carlos (IFSC), Faculdade de Medicina (FM) e o próprio IME, atual sede do programa.
Na década de 1990, pesquisadores do IME foram pioneiros no desenvolvimento de técnicas de programação automática para operadores de imagens a partir de exemplos de imagens e suas respectivas transformações. Tais projetos já eram desenvolvidos em colaboração e financiados por empresas de tecnologia, como a Olivetti. E, como lembra o diretor, na primeira década deste século, o IME foi fundamental para a criação da área de Bioinformática na USP, tendo liderado diferentes iniciativas como o doutorado em Bioinformática, o Núcleo de Apoio à Pesquisa (NAP-PRP) em Bioinformática, e grande participação na implantação da área de análise de dados de expressão gênica medida por microarrays.
Ciência é baseada em dados
A Ciência de Dados é uma área multidisciplinar de estudos que analisa essencialmente “os dados”. “Afinal, a ciência é fortemente baseada em dados”, como descreve Eduardo Ferreira. Ele a considera um setor estratégico para o desenvolvimento de um país, já que se trata de um ramo de estudo multidisciplinar que pode solucionar problemas nas três áreas do conhecimento: exatas, humanas e biológicas.
Em todo e qualquer tipo de pesquisa, de qualquer área do conhecimento, são gerados dados. “A Ciência de Dados trata da coleta, armazenamento e análise de dados que poderão, mais adiante, gerar informação e conhecimento”, descreve. E isso é possível graças à disponibilidade de alguns componentes essenciais que compõem parte das rotinas de estudos e pesquisas do IME, como o uso de instrumentos de medida; bancos de dados, processadores de alto desempenho, sistemas de comunicação; modelos matemáticos representados por algoritmos que permitem extrair informação de dados. “Entre exemplos de aplicações de ciência de dados podemos citar a análise de dados de partidas de futebol para planejamento de estratégias de jogos”, cita Eduardo Ferreira. “Bem como dados integrados de cidades para decisões relativas à segurança pública.”
Além dos “muros” da USP
O professor Roberto Marcondes Cesar Junior, do Departamento de Ciência da Computação (DCC) do IME, atua na organização da Ciência de Dados no instituto. “Temos vários grupos trabalhando e atuamos em diversas iniciativas, como workshops, seminários e pesquisas, aqui desenvolvidas, que conversam entre si”, descreve.
Marcondes lembra que iniciativas do IME já ultrapassam “os muros da Universidade”. Segundo o docente, o IME coopera com o Programa Fapesp de Pesquisa em eScience e Data Science, que financia projetos interdisciplinares na área. “Esse programa foi criado há cerca de seis anos, com a colaboração do IME”, afirma o docente. O professor lembra ainda que no próprio instituto há diversas iniciativas, porém ainda sem uma coordenação dentre elas. “É isso que o IME pretende mudar”, descreve.
O professor destaca, por exemplo, uma reforma que foi realizada no instituto, mais especificamente no curso de Bacharelado em Ciência da Computação do DCC. Dentre as modificações, foi criada a Trilha de Ciência de Dados para os alunos. Nessa trilha, os alunos possuem uma orientação para escolher matérias optativas que tornem sua formação mais bem adequada para atuar como cientistas de dados. Assim, os alunos cursam disciplinas aprofundadas de aprendizado de máquinas, bancos de dados, computação de alto desempenho, estatística, otimização, processamento de sinais e visão computacional.