Whisk: Google lança ferramenta de IA para criação de imagens
Chama-se Whisk e é a nova ferramenta de inteligência artificial (IA) do Google que permite gerar imagens através de outras imagens em vez de exigir um longo prompt de texto.
Com o Whisk, pode apresentar imagens para sugerir o assunto, a cena e o estilo da imagem gerada por IA, podendo ainda solicitar múltiplas imagens para cada uma destas categorias.
Caso não tenha imagens disponíveis, pode recorrer ao ícone de dado, permitindo ao Google preencher os prompts com imagens geradas por IA. Existe também a opção de adicionar detalhes específicos numa caixa de texto no final do processo, embora isto seja opcional.
O Whisk gerará imagens e um prompt de texto para cada imagem. Se estiver satisfeito com os resultados, pode colocar as imagens como favoritas ou descarrega-las. Caso contrário, é possível refiná-las, editando o prompt de texto ou clicando diretamente na imagem para ajustes adicionais.
O Google sublinha que o Whisk foi concebido para uma “exploração visual rápida”, pelo que a empresa reconhece que pode “errar o alvo”. Por essa razão, oferece a possibilidade de editar os prompts gerados.
O Whisk utiliza a versão mais recente do seu modelo de geração de imagens Imagen 3, anunciada também hoje. Além disso, foi também apresentado o Veo 2, a próxima geração do seu modelo de criação de vídeo, com uma compreensão melhorada da “linguagem única da cinematografia” e uma redução de problemas comuns, como dedos extra, uma limitação ainda frequente noutros modelos, como o Sora, da OpenAI.
O Veo 2 será lançado inicialmente no VideoFX do Google, acessível através da lista de espera no Google Labs, com planos para expansão a outros produtos, como o YouTube Shorts, ao longo do próximo ano.