{"id":848,"date":"2026-05-05T16:54:11","date_gmt":"2026-05-05T19:54:11","guid":{"rendered":"https:\/\/spira.ime.usp.br\/?p=848"},"modified":"2026-05-05T17:17:47","modified_gmt":"2026-05-05T20:17:47","slug":"como-a-inteligencia-artificial-aprende-a-analisar-a-voz-por-dentro-dos-modelos-do-spira-bm","status":"publish","type":"post","link":"https:\/\/spira.ime.usp.br\/en\/2026\/05\/05\/como-a-inteligencia-artificial-aprende-a-analisar-a-voz-por-dentro-dos-modelos-do-spira-bm\/","title":{"rendered":"Como a intelig\u00eancia artificial \u201caprende\u201d a analisar a voz: por dentro dos modelos do SPIRA-BM"},"content":{"rendered":"<p class=\"wp-block-paragraph\"><strong>IA aprende com a voz: como redes neurais analisam \u00e1udios para identificar padr\u00f5es associados a condi\u00e7\u00f5es respirat\u00f3rias no projeto SPIRA-BM<br><\/strong><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">No SPIRA-BM, a ideia de que uma intelig\u00eancia artificial pode analisar a voz humana para identificar ind\u00edcios de condi\u00e7\u00f5es respirat\u00f3rias n\u00e3o parte de regras fixas programadas manualmente, mas de um processo de aprendizagem baseado em dados. Em vez de definir previamente quais caracter\u00edsticas da fala indicam uma condi\u00e7\u00e3o cl\u00ednica, os pesquisadores alimentam os modelos com \u00e1udios e permitem que eles identifiquem padr\u00f5es relevantes de forma autom\u00e1tica. \u00c9 nesse contexto que entram as redes neurais artificiais, n\u00facleo do trabalho desenvolvido pelo grupo de big data do projeto.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Segundo Arnaldo Candido Junior, integrante do grupo big data, esse tipo de modelo funciona por meio de exposi\u00e7\u00e3o a dados e ajuste cont\u00ednuo de par\u00e2metros. \u201cVoc\u00ea n\u00e3o precisa programar o modelo para fazer uma tarefa; voc\u00ea apresenta dados para ele e ele se adapta\u201d, explica. O sistema aprende a partir de exemplos, ajustando suas previs\u00f5es conforme os erros identificados ao longo do treinamento.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Para o pesquisador Marcelo Matheus Gauy, que tamb\u00e9m integra a equipe do SPIRA-BM, o desenvolvimento desses modelos de intelig\u00eancia artificial est\u00e1 diretamente ligado \u00e0 ideia de aprendizado a partir de dados reais. Ele explica que, em vez de definir regras expl\u00edcitas sobre o que procurar na voz, o sistema recebe exemplos e aprende sozinho a identificar padr\u00f5es relevantes para a tarefa de classifica\u00e7\u00e3o, o que inclui sinais sutis presentes na fala.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Segundo o pesquisador, essa abordagem permite que os modelos identifiquem caracter\u00edsticas complexas do sinal de \u00e1udio, como varia\u00e7\u00f5es na entona\u00e7\u00e3o, pausas e aspectos temporais da fala, sem que essas informa\u00e7\u00f5es precisem ser previamente codificadas pelos desenvolvedores. \u201cA ideia \u00e9 n\u00e3o dizer para o modelo exatamente o que procurar, mas deixar que ele descubra essas rela\u00e7\u00f5es a partir dos dados\u201d, resume, destacando a proximidade desse processo com t\u00e9cnicas modernas de aprendizado profundo.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Gauy tamb\u00e9m chama aten\u00e7\u00e3o para o desafio da generaliza\u00e7\u00e3o dos modelos, especialmente em contextos como o SPIRA-BM, em que os dados v\u00eam de diferentes fases e ambientes de coleta. Segundo ele, mudan\u00e7as no contexto \u2014 como varia\u00e7\u00f5es entre dados hospitalares e outros tipos de grava\u00e7\u00e3o \u2014 podem afetar o desempenho do sistema, tornando necess\u00e1rio pensar em estrat\u00e9gias que permitam ao modelo manter sua capacidade de identifica\u00e7\u00e3o mesmo diante de cen\u00e1rios distintos.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">No caso do SPIRA-BM, os dados utilizados s\u00e3o \u00e1udios de voz coletados em diferentes contextos, incluindo ambientes hospitalares e grupos de controle. A partir desse material, os modelos passam por um processo de treinamento no qual realizam classifica\u00e7\u00f5es iniciais, como identificar se um \u00e1udio corresponde a um paciente com determinada condi\u00e7\u00e3o ou n\u00e3o. No in\u00edcio, os erros s\u00e3o frequentes, mas o sistema vai sendo ajustado iterativamente at\u00e9 alcan\u00e7ar melhores n\u00edveis de precis\u00e3o.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Um dos principais desafios destacados por Arnaldo \u00e9 a diversidade dos ambientes de coleta. \u00c1udios registrados em hospitais apresentam ru\u00eddos e caracter\u00edsticas muito diferentes daqueles obtidos em outros contextos, como grava\u00e7\u00f5es remotas. Essa varia\u00e7\u00e3o pode levar o modelo a aprender padr\u00f5es indesejados, como o ambiente sonoro, em vez das caracter\u00edsticas da voz associadas \u00e0s condi\u00e7\u00f5es investigadas.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Para lidar com esse problema, a equipe adotou estrat\u00e9gias espec\u00edficas de prepara\u00e7\u00e3o dos dados, incluindo a inser\u00e7\u00e3o de ru\u00eddos hospitalares nos \u00e1udios do grupo de controle. O objetivo foi equilibrar as condi\u00e7\u00f5es de treinamento e garantir que o modelo aprendesse padr\u00f5es relacionados \u00e0 voz e \u00e0 fala, e n\u00e3o \u00e0s interfer\u00eancias do ambiente. Esse cuidado \u00e9 fundamental em sistemas de intelig\u00eancia artificial aplicados \u00e0 sa\u00fade, nos quais vieses nos dados podem comprometer os resultados.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">O funcionamento do modelo pode ser descrito como um ciclo cont\u00ednuo de tentativa, erro e ajuste. Um \u00e1udio \u00e9 apresentado ao sistema em uma representa\u00e7\u00e3o adequada para processamento, e o modelo realiza uma previs\u00e3o \u2014 por exemplo, indicando a presen\u00e7a ou aus\u00eancia de uma condi\u00e7\u00e3o associada \u00e0 sa\u00fade respirat\u00f3ria. Em seguida, essa previs\u00e3o \u00e9 comparada com a resposta correta, e o sistema ajusta seus par\u00e2metros para reduzir erros futuros.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Arnaldo explica que esses modelos s\u00e3o baseados em redes neurais artificiais, um tipo de arquitetura que comp\u00f5e o campo do aprendizado profundo. Essas redes s\u00e3o inspiradas parcialmente no funcionamento do c\u00e9rebro humano, especialmente na ideia de conex\u00f5es entre unidades de processamento, embora operem de forma matem\u00e1tica distinta. Essa estrutura permite identificar padr\u00f5es complexos em sinais de \u00e1udio, como varia\u00e7\u00f5es sutis na fala, pausas e entona\u00e7\u00f5es.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">No SPIRA-BM, esse tipo de tecnologia \u00e9 aplicado ao desenvolvimento de biomarcadores de \u00e1udio associados a condi\u00e7\u00f5es respirat\u00f3rias, como insufici\u00eancia respirat\u00f3ria, efeitos do tabagismo e asma grave. A proposta n\u00e3o \u00e9 substituir diagn\u00f3sticos m\u00e9dicos, mas desenvolver sistemas capazes de analisar padr\u00f5es de forma automatizada e gerar informa\u00e7\u00f5es que auxiliem profissionais de sa\u00fade em processos de triagem e acompanhamento.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ao final, o funcionamento das redes neurais no projeto evidencia um ponto central da intelig\u00eancia artificial contempor\u00e2nea: a capacidade de aprender a partir de dados, mas tamb\u00e9m a depend\u00eancia da qualidade e da diversidade desses dados para produzir resultados confi\u00e1veis. No SPIRA-BM, esse equil\u00edbrio entre aprendizado autom\u00e1tico e rigor metodol\u00f3gico sustenta o desenvolvimento de sistemas voltados \u00e0 an\u00e1lise de \u00e1udio da voz em contextos de sa\u00fade.<\/p>","protected":false},"excerpt":{"rendered":"<p>IA aprende com a voz: como redes neurais analisam \u00e1udios para identificar padr\u00f5es associados a condi\u00e7\u00f5es respirat\u00f3rias no<\/p>","protected":false},"author":1,"featured_media":849,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[31],"tags":[],"post_badge":[],"class_list":["post-848","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-noticia"],"featured_image_urls":{"full":["https:\/\/spira.ime.usp.br\/wp-content\/uploads\/2026\/05\/imagem-capa-1.png",1693,929,false],"thumbnail":["https:\/\/spira.ime.usp.br\/wp-content\/uploads\/2026\/05\/imagem-capa-1-150x150.png",150,150,true],"medium":["https:\/\/spira.ime.usp.br\/wp-content\/uploads\/2026\/05\/imagem-capa-1-300x165.png",300,165,true],"medium_large":["https:\/\/spira.ime.usp.br\/wp-content\/uploads\/2026\/05\/imagem-capa-1-768x421.png",640,351,true],"large":["https:\/\/spira.ime.usp.br\/wp-content\/uploads\/2026\/05\/imagem-capa-1-1024x562.png",640,351,true],"1536x1536":["https:\/\/spira.ime.usp.br\/wp-content\/uploads\/2026\/05\/imagem-capa-1-1536x843.png",1536,843,true],"2048x2048":["https:\/\/spira.ime.usp.br\/wp-content\/uploads\/2026\/05\/imagem-capa-1.png",1693,929,false],"trp-custom-language-flag":["https:\/\/spira.ime.usp.br\/wp-content\/uploads\/2026\/05\/imagem-capa-1-18x10.png",18,10,true],"morenews-featured":["https:\/\/spira.ime.usp.br\/wp-content\/uploads\/2026\/05\/imagem-capa-1-1024x562.png",1024,562,true],"morenews-large":["https:\/\/spira.ime.usp.br\/wp-content\/uploads\/2026\/05\/imagem-capa-1-825x575.png",825,575,true],"morenews-medium":["https:\/\/spira.ime.usp.br\/wp-content\/uploads\/2026\/05\/imagem-capa-1-590x410.png",590,410,true]},"author_info":{"info":["spira.bm"]},"category_info":"<a href=\"https:\/\/spira.ime.usp.br\/en\/category\/noticia\/\" rel=\"category tag\">Not\u00edcia<\/a>","tag_info":"Not\u00edcia","comment_count":"0","_links":{"self":[{"href":"https:\/\/spira.ime.usp.br\/en\/wp-json\/wp\/v2\/posts\/848","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/spira.ime.usp.br\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/spira.ime.usp.br\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/spira.ime.usp.br\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/spira.ime.usp.br\/en\/wp-json\/wp\/v2\/comments?post=848"}],"version-history":[{"count":3,"href":"https:\/\/spira.ime.usp.br\/en\/wp-json\/wp\/v2\/posts\/848\/revisions"}],"predecessor-version":[{"id":852,"href":"https:\/\/spira.ime.usp.br\/en\/wp-json\/wp\/v2\/posts\/848\/revisions\/852"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/spira.ime.usp.br\/en\/wp-json\/wp\/v2\/media\/849"}],"wp:attachment":[{"href":"https:\/\/spira.ime.usp.br\/en\/wp-json\/wp\/v2\/media?parent=848"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/spira.ime.usp.br\/en\/wp-json\/wp\/v2\/categories?post=848"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/spira.ime.usp.br\/en\/wp-json\/wp\/v2\/tags?post=848"},{"taxonomy":"post_badge","embeddable":true,"href":"https:\/\/spira.ime.usp.br\/en\/wp-json\/wp\/v2\/post_badge?post=848"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}