Os desafios com a tecnologia de assistência remota podem ser mais bem abordados por humanos e inteligência artificial trabalhando juntos, mostra um novo estudo. De acordo com pesquisadores da Faculdade de Ciências e Tecnologia da Informação da Universidade Estadual da Pensilvânia, a inteligência artificial (IA) pode ajudar a resolver os desafios apresentados pela tecnologia atual de visão computacional, como a assistência à visão remota (RSA, na sigla em inglês).
O RSA ajuda as pessoas com baixa ou nenhuma visão a navegar em várias tarefas que exigem visão, conectando-as a agentes humanos por meio de uma chamada de vídeo em seus smartphones. No entanto, as limitações nas tecnologias de visão computacional existentes significam que elas não podem oferecer suporte total a um agente que atenda a determinadas solicitações, como reconhecer informações de voo na tela digital de um aeroporto ou ler instruções em um frasco de remédio.
Em um estudo apresentado na 27ª Conferência Internacional sobre Interfaces de Usuário Inteligentes em março, os pesquisadores argumentaram que alguns desses desafios não podem ser abordados apenas pelas tecnologias de visão computacional existentes, mas garantem um novo desenvolvimento na colaboração humano-IA. John M. Carroll, Ph.D., professor de ciências e tecnologia da informação, afirmou que abordar essas questões tem o potencial de avançar na pesquisa de tecnologia de visão computacional e inaugurar a próxima geração de serviços RSA.
“Estamos interessados em desenvolver esse paradigma em particular porque é uma atividade colaborativa envolvendo pessoas com e sem visão, bem como recursos de visão computacional”, disse Carroll no comunicado à imprensa. “Nós o enquadramos de uma maneira muito rica, onde há muitas questões interessantes de interação humano-humano, interação humano-tecnologia e inovação tecnológica”.
A tecnologia RSA está disponível por meio de aplicativos gratuitos ou como um serviço pago que conecta usuários com deficiência visual a agentes com visão. A função de vídeo ao vivo do serviço permite que o agente olhe pela câmera do usuário para auxiliá-lo em sua solicitação.
“Por exemplo, criar uma visão de mundo olhando através da câmera é mentalmente exigente para os agentes”, disse Syed Billah, Ph.D., professor assistente de ciências da informação e tecnologia, no comunicado de imprensa. “Essa tarefa pode ser transferida para computadores que executam um algoritmo de reconstrução 3D.”
Esse suporte pode ser desgastante para os agentes, especialmente ao auxiliar os usuários em tarefas de alto risco, como navegar em um estacionamento. Essas são as questões que abrem espaço para melhorias na tecnologia atual de visão computacional, disse Billah.
Carroll e seus colaboradores revisaram as tecnologias RSA existentes e entrevistaram usuários para entender seus desafios ao usar esses serviços. Os pesquisadores então identificaram desafios que poderiam ser abordados com as tecnologias de visão computacional existentes e sugeriram ideias de design para resolvê-los, como aumentar os fluxos de vídeo com textos, gráficos e objetos detectados.
Mas os pesquisadores destacaram cinco questões emergentes que a tecnologia atual não pode resolver devido à sua complexidade. Esses problemas estão relacionados ao reconhecimento de que objetos comumente identificados como obstáculos por câmeras de smartphones podem não ser considerados obstáculos por pessoas com deficiência visual, ajudando os usuários a navegar em seu ambiente quando uma câmera ao vivo pode ser perdida durante a baixa largura de banda celular, reconhecendo conteúdo em telas LCD digitais, reconhecendo textos em superfícies irregulares e prevendo como as pessoas ou objetos fora do quadro se moverão.
Esses problemas podem ser resolvidos utilizando a IA ao lado de agentes humanos para melhorar a experiência do usuário para indivíduos com deficiência visual. No entanto, a pesquisa e o desenvolvimento de tais métodos ainda estão em andamento.