Tecnologia de IA pode ajudar pessoas com deficiência na fala a trabalhar de casa

#Compartilhar:

Você provavelmente já passou pela frustração de ser mal ouvido ou mal entendido por um alto-falante inteligente ou assistente de perceptibilidade sintético. Para pessoas que possuem a fala dissemelhante do padrão, isso pode suceder em quase todas as interações com esse tipo de tecnologia, mas a empresa israelense Voiceitt pretende mudar isso.

Ao usar modelos de voz personalizados, seu sistema de reconhecimento de fala com tecnologia de IA ajuda pessoas com deficiências de fala, causadas por condições porquê paralisia cerebral, Parkinson, Síndrome de Down ou derrame, a se comunicarem de forma mais eficiente tanto com outras pessoas quanto com dispositivos digitais.

Para a cofundadora da Voiceitt, Sara Smolley, facilitar o reconhecimento de voz para pessoas com fala não padronizada é uma missão pessoal.

“Minha avó foi diagnosticada com doença de Parkinson de início precoce”, ela disse. “Quando eu nasci, ela tinha perdido a maioria de suas capacidades motoras, e sua fala foi impactada.”

O Voiceitt foi lançado porquê um aplicativo em 2021 e operava porquê um tradutor vocal simples, convertendo a fala não padrão em áudio. A IA é treinada pelo usuário gravando a si mesmo dizendo murado de 200 frases simples de estoque.

Smolley disse que a teoria original era facilitar a notícia presencial, mas a tecnologia agora também foi adaptada para trabalhadores remotos.

A Voiceitt desenvolveu integrações com WebEx e ChatGPT, junto com uma extensão do Google Chrome, que converte fala não padrão em legendas mostradas na tela. A empresa também está fazendo uma parceria com Zoom e Microsoft Teams.

“Uma das coisas que realmente se destacou para mim foi a prestígio da tecnologia de acessibilidade no sítio de trabalho”, observou Smolley. “O que uma rampa [para cadeira de rodas] era para o prédio de escritórios de ontem, a Voiceitt é para o sítio de trabalho remoto de hoje”, disse ela.

O software é vendido com uma licença por minuto ou por usuário, com preços variando de US$ 20 a US$ 50 (murado de R$ 108,00 a R$ 270,00). As licenças podem ser compradas em grandes quantidades para locais de trabalho e instituições de saúde ou ensino.

“As pessoas estão usando o Voiceitt não unicamente para videoconferências, mas para ortografar documentos, e-mails, postar no LinkedIn e acessar navegadores da web por voz”, explicou Smolley. “Isso abriu o mundo do dedo para indivíduos que antes talvez não fossem considerados para certos empregos ou capazes de se discursar com colegas ou clientes.”

“Todo nascente setor precisa de uma sacudida”

Entre os usuários do Voiceitt está Colin Hughes, um ex-produtor da BBC que virou padroeiro da acessibilidade. Vivendo com distrofia muscular, Hughes depende do ditado para suas interações digitais, o que o torna extremamente cônscio do potencial e das limitações das tecnologias atuais. Hughes experimentou o Voiceitt para inventar e-mails e ditar peças escritas mais longas.

“Achei o aplicativo da Voiceitt impressionantemente preciso com minha fala atípica, e seu processo de treinamento e feitio foi direto”, disse Hughes, embora tenha engrandecido lacunas críticas para usuários profissionais. “Muitas pessoas com fala prejudicada e deficiências nos membros superiores precisam de mais do que unicamente fala para texto”, observou ele.

Ele defende a soma de recursos porquê controle de cursor por voz e reconhecimento de ditado civilizado para rascunhar teor longo, dizendo que o Voiceitt funciona melhor para mensagens de frases únicas.

Hughes enfatiza a premência de uma tecnologia de reconhecimento de fala mais abrangente que permita aos usuários fazer coisas porquê gerenciar e-mails e formatar documentos usando a voz.

Ele vê um porvir onde a tecnologia desempenha um papel maior na acessibilidade, acrescentando: “Todo esse setor precisa de uma sacudida. A Voiceitt, com melhor entrada às principais plataformas, pode ser a líder dessa mudança.”

Um porvir atingível

De concordância com Smolley, houve um progresso significativo na tecnologia de reconhecimento de fala nos últimos anos.

Um exemplo é o Speech Accessibility Project, um projeto de pesquisa liderado pelo Instituto Beckman de Ciência e Tecnologia Avançada da Universidade de Illinois, que está coletando dados de voz de pessoas com diferentes condições para fabricar algoritmos para dar suporte a pessoas com fala não padronizada.

No início deste ano, a Apple lançou seu recurso “Listen for Atypical Speech” (Ouvir Fala Atípica), nutrido por IA, que usa aprendizagem de máquina para reconhecer uma gama mais ampla de padrões de fala.

Com a tecnologia que conquista e armazena dados pessoais, porquê gravações de voz, a privacidade pode ser uma preocupação para os usuários. Smolley diz que sua empresa está em conformidade com os regulamentos da União Europeia, que ela labareda de “os mais altos padrões do mundo em termos de privacidade de dados”.

“Se os dados do usuário forem mantidos em nosso banco de dados com seu consentimento, eles serão anonimizados e desidentificados, e usados ​​para aumentar nossa rima de dados e melhorar nosso algoritmo”, ela acrescenta.

Ela acredita que a tecnologia da Voiceitt pode mudar vidas. “Queremos permitir que as pessoas não unicamente sejam mais independentes em suas vidas e trabalho”, diz Smolley, “mas também que aproveitem a tecnologia e se divirtam”.

FONTE:CNN

#Compartilhar:
error:
Rolar para cima