Neste Quem faz o SPIRA, destacamos nossa entrevista com Arnaldo Candido Junior, um dos nomes centrais do chamado grupo de big data do SPIRA-BM. Ao longo da conversa, o pesquisador detalha como é atuar como um dos responsáveis pela dimensão de inteligência artificial do projeto, explicando o papel estratégico dos modelos computacionais e dos processos de aprendizagem de máquina no desenvolvimento de soluções inovadoras para análise de dados em saúde.
Com sólida formação acadêmica, Arnaldo Candido Junior possui graduação em Ciência da Computação pela Universidade Estadual Paulista Júlio de Mesquita Filho (2005), além de mestrado (2008) e doutorado em Ciências da Computação e Matemática Computacional pelo Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo. Atualmente professor da UNESP, sua trajetória é marcada pela atuação nas áreas de Linguagens de Programação e Inteligência Artificial, com ênfase em Processamento de Língua Natural e Processamento da Fala, o que o posiciona como uma peça-chave na articulação entre ciência de dados e inovação tecnológica no SPIRA-BM.
Como se deu a sua entrada no projeto?
O professor Marcelo Finger convidou a professora Sandra Luiso, sendo que ela estendeu o convite para mim. Naquela época eu já trabalhava com processamento de fala e estávamos no auge da pandemia. Aquele período, de certa forma, deixou o mundo meio de cabeça para baixo, né? E nós estávamos tentando, dentro daquilo que podíamos tentar ser útil para a sociedade. Então, o Marcelo teve uma ideia muito interessante de tentar detectar a COVID pela voz das pessoas. Isso me chamou muito a atenção.
Porque você topou participar do projeto?
No meu caso, eu trabalho bastante com modelos de aprendizado de máquina, em particular, com redes neurais e, ais recentemente, modelos profundos. Por isso, acredito que a minha maior contribuição para o projeto venha da aplicação desses modelos, ou seja, criar inteligências artificias que consigam analisar os dados e dar uma detecção positiva ou negativa. Faço parte do chamado grupo big data, que trabalha com essa dimensão do SPIRA.
Quais foram as suas primeiras ações como integrante da equipe do big data?
Destaco, sobretudo, a questão do acesso aos dados que realizamos a partir das nossas coletas. Desde o início, essas captações de voz e fala se deram em dois ambientes: nos hospitais (pacientes) e em outros espaços como inicialmente a própria web (grupo controle incialmente convidado a participar enviando a voz via internet). Neste contexto, um dos principais desafios da análise inicial foi trabalhar os áudios que vinham de diferentes ambientes. Em outras palavras, tínhamos a preocupação de fazer modelos justos que analisassem, de fato, a voz e a fala das pessoas, sem uma interferência negativa do ruído ambiente nesse processo. Como os modelos são automáticos esse foi um grande desafio. Chegamos a injetar ruído dos hospitais nos áudios do grupo controle, medida tomada para evitar que o modelo ficasse viciado nos barulhos do ambiente, pois o foco sempre foi a voz e a fala.
Na prática, como funcionam esses modelos do SPIRA-BM?
Eles são aprendizado de máquina, em particular, um tipo especial que é chamado de rede neural artificial. Esse tipo de modelo é parcialmente inspirado no funcionamento do cérebro humano, dos neurônios biológicos, mas também com algumas importantes diferenças. Como todo modelo de aprendizado de máquina, ele tem uma característica interessante: você não precisa programa o modelo para fazer uma tarefa; você apresenta dados para ele e ele se adapta mais ou menos automaticamente ao comando, utilizando os nossos algoritmos de treinamento. Popularmente, dizemos que o modelo aprendeu a fazer aquela tarefa. Os nossos modelos são construídos assim: A gente tem uma série de áudios de pacientes e do grupo controle. Então, mostramos um áudio para o modelo, numa representação de que ele consiga entender e processá-lo. Então, criamos justamente uma representação ideal desses áudios e o modelo faz uma previsão. por exemplo, verdadeiro/positivo que uma pessoa está com COVID ou falso/negativo que uma pessoa esteja com essa condição. No começo, é comum que o modelo erre bastante, pois ele vai sendo treinado e se adaptando. Também realizamos ajustes conformes os erros do modelo e, assim, suas previsões vão melhorando e ele se torna cada vez mais preciso.
Além do software que utiliza os modelos para analisar os dados, temos ainda um software de coleta da voz e da fala, professor. Como essas duas tecnologias se relacionam no projeto?
Sim, antes de tudo, temos um programa instalado em celulares para coletar áudios e enviar eles para uma base da dados. Esse software utiliza, sobretudo, técnicas mais tradicionais de programação e informática. Posteriormente, tais dados são processados, gerados no nosso modelo que é, por sua vez, incorporado num software de detecção que utiliza inteligência artificial, sendo este pensado para futuramente, por exemplo, ajudar um profissional da saúde a fazer o diagnóstico da COVID ou de outra condição respiratória. Então, sim, são dois softawares diferentes que se relacionam: um para coletar e outro para detectar. A nossa ideia, vale lembrar, é disponibilizar esses modelos para a comunidade de forma gratuita.
Como que vocês imaginam que esses modelos de decisão, isto é, um software de detecção funcione no dia a dia dos centros de saúde?
Então, nós temos um cuidado para que dentro do possível os modelos sejam leves, com menos processamento, justamente para rodarem em celulares, por exemplo. Mas se será por dispositivo móvel ou por computador, isso também dependerá das necessidades e contextos dos hospitais e clínicas. Por isso, lembro que talvez a nossa maior contribuição não seja de um software em si, mas de um modelo.
De que forma você observa as dimensões temáticas do SPIRA-BM com a sua própria trajetória como pesquisador?
Há muitos anos eu trabalho bastante com inteligência artificial. Mais recentemente, eu também passei a trabalhar um pouco com a questão da linguagem de programação. Os meus trabalhos são, aliás, muito voltados para o processamento de língua natural. A partir ali de 2015, 2016, eu comecei a ficar interessado na parte do processamento da fala, que chamamos de parte baixa da língua, aspectos que possuem grande relação com o SPIRA-BM.
