Voice Search e o futuro que nos espera

Por Ricardo Carreira, CMO da Adclick

Falar em futuro, quando o tema é Voice Search, é quase um exagero. Um estudo da Google revela que 41% dos adultos e 55% dos adolescentes já falam diariamente com os seus dispositivos electrónicos, e há previsões a apontar para um volume de vendas através de assistentes virtuais a superar os 30 mil milhões de dólares já em 2024.

Com o futuro aqui tão perto, ainda vejo muitas oportunidades por explorar – e acredito que em torno delas se construirão as novas estratégias digitais.

Começo pelas métricas. Sendo, para já, impossível distinguir os registos de pesquisas por voz e pesquisas tradicionais, não há forma de medirmos o ROI de quem nos chega por Voice Search. Será necessária uma evolução tecnológica, acompanhada de uma revisão das plataformas de monitorização, para que os profissionais possam planear, fazer previsões e alocar orçamentos sem recorrer ao instinto ou à adivinhação.

Uma vez desenvolvidas as ferramentas necessárias, acredito que teremos acesso a uma análise mais transparente do real valor do Voice Search. Seremos, então, capazes de desenhar estratégias sólidas e criativas, adaptadas a cada negócio.

Falando em orçamentos e estratégia, coloca-se a questão da monetização. Com o boom da Internet das Coisas, até os aparelhos mais impensáveis passam a falar com (e a ouvir) o utilizador. Esta interacção pode, de forma indirecta, ser uma oportunidade de monetização – porque o meu frigorífico pode não vender mercearia, mas pode perceber, pela minha conversa com ele, que vou precisar de comprar leite nos próximos dias.

Por outro lado, a forma sequencial como utilizo os meus aparelhos digitais – se for replicada por um número relevante de outros utilizadores – pode deixar a descoberto uma oportunidade de negócio para um produto ou serviço que ainda não exista e que nunca nos tínhamos apercebido de que faltava (ou até para um aparelho que, sendo “mudo” até aqui, possa passar a falar).

Claro que, de mãos dadas com a monetização e ainda mais potenciado pela capacidade de os aparelhos electrónicos nos ouvirem em permanência, está a questão da privacidade. Acredito que o advento do Voice Search venha tornar necessário um reforço das regras de privacidade de informação, da mesma forma que pode abrir espaço a uma maior invasão do nosso espaço pessoal. Será necessário estabelecer um limite para o que é aceitável os aparelhos ouvirem e registarem para memória futura – e aqui acrescento a necessidade de definir uma forma de o utilizador controlar a anonimidade da navegação, numa espécie de “botão off the record” vocal.

Por outro lado, há que reimaginar os espaços publicitários. O que acontecerá aos espaços pagos na página de resultados quando o utilizador só recebe a resposta por áudio? Como construir um bom CTA se formos devolvidos ao canal sonoro, como se de anúncios na rádio se tratassem? Até as estratégias multicanal terão de ser adaptadas na sua criatividade, para que possam ser ditadas e consumidas por meio exclusivamente sonoro.

Depois há a questão da confiança. Se, nas SERP tradicionais, os espaços pagos aparecem discretamente destacados, difícil será encontrar um equilíbrio para um modelo baseado na voz. Se é certo que o utilizador terá de ser avisado de que está a ouvir um conteúdo patrocinado, coloco algumas reticências sobre a confiança que terá nesse conteúdo após semelhante alerta. Aqui acrescento ainda a questão do sentimento de intrusão. Não me sentindo invadido quando vejo resultados pagos numa SERP, não tenho a certeza se estaria tão disposto a ouvir respostas pagas por parte do meu assistente virtual – até porque do meu assistente virtual espero imediatismo, transparência e genuinidade na interacção.

Ainda no campo da publicidade, antevejo algumas adaptações na forma como ela é oferecida e procurada entre publishers e anunciantes. Sabendo que as pesquisas por voz são marcadas, em grande parte, pela geografia – com muitos utilizadores a usarem expressões como “perto de mim” – prevejo relevantes alterações nos critérios de distribuição.

Por fim, a mudança mais esperada pelos profissionais com o crescimento do Voice Search: a optimização de conteúdos.

O desenvolvimento avançado das tecnologias de reconhecimento de voz já vem aliado à capacidade interpretativa dos algoritmos – que, de resto, até chegaram primeiro (basta pensarmos no Hummingbird da Google, que foi lançado no ido ano de 2013). Se pensarmos que os novos sistemas são capazes até de indexar podcasts e vídeos (porque conseguem perceber o que neles é falado), não parece assim tão utópico pensarmos na substituição do SEO pelo PASO (Personal Assistant Search Optimization).

O PASO vai, a meu ver, agregar diferentes dimensões. Se, por um lado, importa o que é falado, por outro continuará a ser necessária uma optimização mais tradicional, com metadados, optimização de transcrições e “alt” tags.

Tenho, neste caso, de destacar o recém-criado Speakable, da Google, que acredito ser portador de várias mensagens. Por um lado, não estamos perante a morte do conteúdo tradicional (porque a ferramenta serve precisamente para optimizar conteúdo textual longo para as pesquisas por voz), mas será necessário considerarmos cada peça de conteúdo como tendo possíveis formas de consumo. O objectivo não será, portanto, criarmos uma peça para cada modalidade de consumo, mas construirmos um universo em que tudo pode ser consumido com os olhos e com os ouvidos sem perder qualidade.

Parece mais fácil do que é, na verdade. Não só porque um assistente não vai ler um texto completo (80% das pesquisas dos assistentes virtuais são para respostas simples a perguntas específicas), mas porque será importante garantirmos que, ao navegar pelo nosso conteúdo, o assistente encontre facilmente a resposta certa para a pergunta que lhe foi colocada. Neste momento pode estar em causa toda a credibilidade da página: é impossível acreditar que a experiência do utilizador não sai prejudicada se o assistente encontrar o conteúdo certo, mas der a resposta errada.

Já que se fala em experiência do utilizador, termino com uma nota para as mudanças que podem vir no campo da relação com as marcas. Não sendo um problema específico dos publishers, o crescimento da voz no universo digital vai trazer grandes desafios à transposição de personalidades para conteúdos.

A verdade é que a voz é uma das mais populares formas de interacção para os humanos. Ela diz muito sobre a personalidade de cada um e a relação que mantêm entre si – e isso transparece para as marcas a partir do momento em que os consumidores também passam a interagir oralmente com elas.

Falo da utilização da voz para consumir produtos e serviços, por exemplo. A forma como o utilizador interage com a marca vai fornecer pistas sobre a relação que tem com ela e sobre a (in)coerência entre a imagem percebida e a imagem projetada. Se, por um lado, a voz do utilizador é uma fonte de informação valiosa que as marcas vão querer aproveitar, por outro lado, ela também é um veículo para construção de ligações emocionais que não pode ser desperdiçado.

Acredito que, como em todas as tecnologias, o melhor futuro é o dos que se antecipam. Com maior ou menor confiança, será importante ir explorando e experimentando – até porque é nesta fase inicial que se toleram melhor as tentativas falhadas. A corrida é ganha pelos que partem primeiro, por isso o melhor é começar a desenhar já a estratégia de amanhã.

Artigos relacionados