{"id":58612,"date":"2022-11-30T12:41:51","date_gmt":"2022-11-30T16:41:51","guid":{"rendered":"https:\/\/crea-am.org.br\/creaam_site\/?p=58612"},"modified":"2022-11-30T12:41:55","modified_gmt":"2022-11-30T16:41:55","slug":"ia-usa-movimentos-labiais-para-reconhecer-falas-em-diferentes-idiomas","status":"publish","type":"post","link":"https:\/\/crea-am.org.br\/creaam_site\/ia-usa-movimentos-labiais-para-reconhecer-falas-em-diferentes-idiomas\/","title":{"rendered":"IA usa movimentos labiais para reconhecer falas em diferentes idiomas"},"content":{"rendered":"<div id=\"attachment_58613\" style=\"width: 730px\" class=\"wp-caption aligncenter\"><a href=\"https:\/\/crea-am.org.br\/creaam_site\/ia-usa-movimentos-labiais-para-reconhecer-falas-em-diferentes-idiomas\/i655643\/\" rel=\"attachment wp-att-58613\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-58613\" class=\"size-full wp-image-58613\" src=\"https:\/\/crea-am.org.br\/creaam_site\/wp-content\/uploads\/i655643.webp\" alt=\"\" width=\"720\" height=\"405\" srcset=\"https:\/\/crea-am.org.br\/creaam_site\/wp-content\/uploads\/i655643.webp 720w, https:\/\/crea-am.org.br\/creaam_site\/wp-content\/uploads\/i655643-300x169.webp 300w, https:\/\/crea-am.org.br\/creaam_site\/wp-content\/uploads\/i655643-480x270.webp 480w\" sizes=\"auto, (max-width: 720px) 100vw, 720px\" \/><\/a><p id=\"caption-attachment-58613\" class=\"wp-caption-text\">Imagem: Canal Tech<\/p><\/div>\n<p>Pesquisadores do Imperial College London, na Inglaterra, desenvolveram um novo modelo de intelig\u00eancia artificial (IA), capaz de reconhecer com precis\u00e3o o conte\u00fado de uma fala em v\u00e1rios idiomas diferentes, com base apenas nos movimentos dos l\u00e1bios dos usu\u00e1rios. Segundos os cientistas, esse sistema de reconhecimento visual de fala (VSR, na sigla em ingl\u00eas) utiliza algoritmos de aprendizado profundo para analisar o movimento labial, transformando as imagens captadas em conjuntos de caracteres conforme o idioma que est\u00e1 sendo falado.<\/p>\n<p>\u201cEmbora alguns algoritmos tenham alcan\u00e7ado resultados promissores em tarefas VSR, eles foram treinados principalmente para detectar falas em ingl\u00eas. Isso limita sua base de usu\u00e1rios em potencial a pessoas que vivem ou trabalham em contextos de l\u00edngua inglesa\u201d, explicou o professor e autor principal do estudo, Pingchuan Ma, ao site TechXplore.<\/p>\n<h2><span style=\"font-size: 18pt\">Modelo poliglota<\/span><\/h2>\n<p>O treinamento do novo algoritmo foi feito com base em um modelo de aprendizado profundo, capaz de reconhecer movimentos labiais em diversos idiomas. Esse sistema utilizado pelos cientistas \u00e9 semelhante ao introduzido por estudos anteriores, mas com um conjunto de dados muito maior.<\/p>\n<p>Simplificando, esse modelo recebe imagens brutas e aprende automaticamente quais recursos deve extrair para concluir a tarefa de reconhecimento visual da fala. Essa abordagem amplifica a quantidade de informa\u00e7\u00f5es necess\u00e1rias para que o algoritmo consiga interpretar praticamente qualquer idioma.<\/p>\n<p>\u201cOs resultados mostram que \u00e9 poss\u00edvel moldar nosso modelo independentemente da l\u00edngua que est\u00e1 sendo falada. Nos testes iniciais, tivemos um desempenho muito bom, superando outros sistemas de VSR treinados com conjuntos de dados muito maiores\u201d, acrescentou o professor Ma.<\/p>\n<h2>Falta flu\u00eancia<\/h2>\n<p>Como j\u00e1 era esperado pelos pesquisadores, o novo algoritmo n\u00e3o teve um desempenho t\u00e3o bom quanto os modelos de reconhecimento de fala em ingl\u00eas, principalmente devido aos conjuntos menores de dados dispon\u00edveis para o treinamento da intelig\u00eancia artificial.<\/p>\n<p>Mesmo apresentando uma flu\u00eancia reduzida em outros idiomas, os cientistas acreditam que esse \u00e9 um passo importante para o desenvolvimento de modelos alternativos de VSR, capazes de reconhecer a fala a partir de movimentos labiais em outras l\u00ednguas al\u00e9m do ingl\u00eas.<\/p>\n<p>\u201cNo futuro, poderemos combinar os modelos de VSR com sistemas de reconhecimento de fala baseados em \u00e1udio. Com isso, em um ambiente ruidoso, um modelo audiovisual deve confiar mais no fluxo visual, mas quando a regi\u00e3o da boca estiver oclu\u00edda, ele depender\u00e1 mais do sistema sonoro, podendo se adaptar \u00e0s condi\u00e7\u00f5es do local\u201d, disse o professor Pingchuan Ma.<\/p>\n<p>Fonte: Canal Tech<\/p>\n","protected":false},"excerpt":{"rendered":"<p>O treinamento do novo algoritmo foi feito com base em um modelo de aprendizado profundo, capaz de reconhecer movimentos labiais em diversos idiomas<\/p>\n","protected":false},"author":73,"featured_media":58613,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","footnotes":""},"categories":[102],"tags":[],"class_list":["post-58612","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia"],"_links":{"self":[{"href":"https:\/\/crea-am.org.br\/creaam_site\/wp-json\/wp\/v2\/posts\/58612","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/crea-am.org.br\/creaam_site\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/crea-am.org.br\/creaam_site\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/crea-am.org.br\/creaam_site\/wp-json\/wp\/v2\/users\/73"}],"replies":[{"embeddable":true,"href":"https:\/\/crea-am.org.br\/creaam_site\/wp-json\/wp\/v2\/comments?post=58612"}],"version-history":[{"count":2,"href":"https:\/\/crea-am.org.br\/creaam_site\/wp-json\/wp\/v2\/posts\/58612\/revisions"}],"predecessor-version":[{"id":58615,"href":"https:\/\/crea-am.org.br\/creaam_site\/wp-json\/wp\/v2\/posts\/58612\/revisions\/58615"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/crea-am.org.br\/creaam_site\/wp-json\/wp\/v2\/media\/58613"}],"wp:attachment":[{"href":"https:\/\/crea-am.org.br\/creaam_site\/wp-json\/wp\/v2\/media?parent=58612"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/crea-am.org.br\/creaam_site\/wp-json\/wp\/v2\/categories?post=58612"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/crea-am.org.br\/creaam_site\/wp-json\/wp\/v2\/tags?post=58612"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}