A OpenAI, criadora do ChatGPT, está a apostar na inteligência artificial baseada em áudio, numa estratégia que acompanha uma tendência mais ampla da indústria tecnológica e que passa por reduzir a dependência dos ecrãs e colocar a voz no centro da interação com a tecnologia. Segundo o TechCrunch, a empresa unificou recentemente várias equipas de engenharia, produto e investigação para reformular os seus modelos de áudio, preparando o lançamento de um dispositivo pessoal “audio-first” previsto para este ano.
Esta movimentação não se limita a tornar o ChatGPT mais natural, tendo como objetivo a criação de uma nova geração de dispositivos que funcionem como companheiros conversacionais, capazes de interagir de forma contínua, natural e quase invisível no quotidiano das pessoas.
A aposta da OpenAI reflete uma mudança estrutural transversal ao setor, tendo a Meta também lançado recentemente funcionalidades para os seus óculos inteligentes Ray-Ban que melhoram a audição em ambientes ruidosos. A Google começou também a testar resumos de pesquisa em formato áudio, enquanto a Tesla está a integrar o chatbot Grok nos seus veículos para permitir uma interação totalmente conversacional com o automóvel.
Embora alguns projetos levantem questões relacionadas com a privacidade ou aceitação social, o áudio tem sido encarado como a interface do futuro, sendo que os agora aguardados novos modelos de áudio da OpenAI deverão soar mais naturais, lidar melhor com interrupções e até falar em simultâneo com o utilizador, algo que os sistemas atuais ainda não conseguem fazer.














