Integrantes da equipe multidisciplinar do SPIRA-BM destacam evidências iniciais sobre alterações na fala associadas a condições respiratórias e destaca desafios na validação e ampliação dos dados
Modelos de inteligência artificial com alto índice de precisão na detecção de insuficiência respiratória e evidências de que diferentes condições respiratórias afetam pausas, padrões gramaticais e aspectos da voz marcam o processo científico em torno do SPIRA-BM. Nesse contexto, o projeto já apresenta resultados promissores e, ao mesmo tempo, enfrenta desafios naturais de toda pesquisa. A seguir, destacamos relatos de cinco integrantes do estudo sobre as principais descobertas e os pontos a avançar da investigação.
Entre os resultados já observados no SPIRA, destaca-se, por exemplo, o desempenho dos modelos computacionais desenvolvidos para análise de áudio. Marcelo Matheus Gauy, professor da Universidade Estadual Paulista, campus de Itapeva, com atuação na área de aprendizado profundo, afirma que foram obtidos “modelos de áudio que obtenham acurácia acima de 95% na detecção de insuficiência respiratória”. O dado indica elevado grau de precisão na identificação de padrões associados à condição clínica.
Do ponto de vista clínico, também surgiram evidências sobre alterações na fala associadas a doenças respiratórias. Celso Ricardo Fernandes de Carvalho, professor da Faculdade de Medicina da Universidade de São Paulo, na área de Fisioterapia, com atuação em reabilitação respiratória e interface direta com a pneumologia, afirma que “as pessoas com asma têm características de fala distintas das pessoas sem asma, por exemplo, um maior número de pausas ao falar uma sentença”. Ele acrescenta que “as pessoas com mais sintomas respiratórios também têm alteração dos aspectos da voz”.
Na interface entre linguística e tecnologia, Beatriz Raposo de Medeiros, docente da Universidade de São Paulo, com atuação em fonética e fonologia, destaca que “a questão da interpretabilidade dos resultados das máquinas deve ser feita por linguistas, especialistas em fonética e fonologia”. Ela ressalta ainda que “qualquer que seja o biomarcador detectado, é preciso chegar ao diagnóstico a partir do exame clínico do paciente”.
No campo da inteligência artificial aplicada a sinais, Murilo Gazzola, professor da Universidade Presbiteriana Mackenzie e pesquisador associado ao projeto, afirma que abordagens modernas de inteligência artificial, especialmente deep learning aplicado a sinais, conseguem extrair informações relevantes de padrões que antes passariam despercebidos. Segundo o pesquisador, “pequenas variações no áudio podem carregar biomarcadores importantes”, reforçando o potencial da linha de pesquisa.
Sob a perspectiva linguística, Flaviane Romani Fernandes Svartman, professora do Departamento de Linguística da Faculdade de Filosofia, Letras e Ciências Humanas da Universidade de São Paulo, com atuação na área de prosódia, afirma que “a COVID-19 afeta padrões gramaticais da linguagem”. De acordo com a pesquisadora, “a fala de pacientes com insuficiência respiratória, em decorrência da COVID-19, apresenta pausas em lugares não esperados nos enunciados, como, por exemplo, entre um artigo e um nome”.
Se as descobertas indicam avanços, os desafios permanecem significativos. Marcelo Matheus Gauy aponta que será necessário “criar modelos de alta precisão na detecção dos problemas respiratórios, mesmo quando o contexto do áudio coletado seja bastante diferente do contexto dos áudios usados para treinamento”. O pesquisador observa que coletas em ampla escala ajudariam a enfrentar essa dificuldade, mas reconhece limitações iniciais, o que exige “métodos alternativos que contornem a tendência dos modelos de aprendizado de máquina de serem eficazes apenas dentro do contexto onde foram treinados”.
Para Celso Ricardo Fernandes de Carvalho, o principal desafio é “comprovar que os biomarcadores poderão ser utilizados para o melhor tratamento clínico”. Ele acrescenta que compreender esses biomarcadores “dentro de uma visão multidisciplinar e multiprofissional” é um dos pontos centrais da pesquisa.
Beatriz Raposo de Medeiros aponta como entraves “a grande quantidade de dados e sua falta de balanceamento, muitas vezes”, destacando que há “muitos dados de pacientes de asma, mas poucos de controle”. A pesquisadora também menciona a variabilidade das produções de “parlenda”, que incluem “até trechos cantados, além de orações e poemas curtos”.
Murilo Gazzola identifica desafios como “a variabilidade dos sinais de áudio, a presença de ruídos ambientais e a dificuldade de obter dados clínicos bem anotados e em quantidade suficiente”. O pesquisador alerta ainda para “o risco de modelos de IA superajustarem a características irrelevantes do som, reduzindo a generalização” e defende o uso de bases diversificadas, técnicas de limpeza e validação com dados externos.
Flaviane Romani Fernandes Svartman destaca que “um dos principais desafios atuais […] é o corpus de coleta”. Segundo a especialista, a ocorrência de pausas pode estar associada não apenas à insuficiência respiratória, mas também a fatores como dificuldade de leitura, memória ou desconhecimento da parlenda, o que exige “outras estratégias de construção de corpus de coleta”, envolvendo diferentes contextos discursivos.
Ao articular diferentes áreas do conhecimento e testar seus resultados em contexto clínico, o SPIRA-BM avança em uma frente ainda pouco explorada na saúde: o uso da voz e dos sons respiratórios como fonte complementar de informação sobre condições respiratórias. Entre achados relevantes e questões metodológicas em aberto, a pesquisa evidencia tanto o potencial quanto a complexidade de transformar padrões de áudio em biomarcadores consistentes, indicando que os próximos passos dependerão da consolidação dos dados, do diálogo com a prática clínica e do enfrentamento dos limites já apontados pela própria equipe.
