A Google anunciou hoje, 15 de outubro, a integração de uma nova funcionalidade de conversão de fotografia em vídeo diretamente na aplicação Gemini. Baseada no modelo de geração de vídeo Veo 3, a ferramenta permite aos utilizadores transformar imagens estáticas em videoclipes dinâmicos através de instruções em linguagem natural.
O acesso a esta funcionalidade começa a ser disponibilizado hoje em Portugal, exclusivamente para os subscritores dos planos de acesso premium da empresa, designados AI Ultra e Pro. Com este lançamento a Google reforça a sua estratégia de transformação do Gemini numa plataforma de criação de conteúdo multimodal, ao incorporar uma das mais avançadas tecnologias de vídeo generativo da Google DeepMind num produto de acesso ao consumidor.
Processo de geração e fluxo de trabalho integrado
O processo de criação de vídeo foi desenhado para oferecer flexibilidade, facultando dois pontos de partida distintos dentro da aplicação Gemini. A primeira via consiste no carregamento de uma fotografia preexistente pelo utilizador.
Alternativamente, e num fluxo de trabalho inteiramente generativo, os utilizadores podem primeiro criar uma imagem de base através da ferramenta “Nano Banana“, que a Google descreve como o seu modelo de topo para geração de imagens. Esta segunda via permite a criação de conteúdo do conceito à animação final sem sair do ecossistema Gemini. Em ambos os casos, após a seleção da imagem, o utilizador descreve, através de um prompt de texto, a animação desejada e a componente de áudio, incluindo diálogos, efeitos sonoros e ruído ambiente.

Especificações técnicas e modelo de acesso
A nova funcionalidade é alimentada pelo Veo 3, o mais recente modelo da família de IA para geração de vídeo da Google. O resultado do processo é um videoclipe com as seguintes especificações técnicas:
- Duração: 8 segundos
- Resolução: 720p
- Formato: Ficheiro MP4
- Proporção: 16:9 (formato horizontal)
A Google confirmou que a funcionalidade começa a ser implementada hoje para os subscritores elegíveis, tanto na interface web como nas aplicações móveis do Gemini. A sua vinculação aos planos pagos sublinha a estratégia da empresa de monetizar as suas capacidades de IA mais avançadas, posicionando-as como ferramentas de produtividade e criatividade para um público profissional e entusiasta.
Conclusão
A introdução da capacidade de converter fotografias em vídeo diretamente na aplicação Gemini é mais do que uma simples adição de uma nova ferramenta; é a materialização da estratégia da Google de unificar os seus modelos de IA mais potentes sob uma única interface. Ao alavancar o poder do Veo 3 e integrá-lo com a geração de imagem do “Nano Banana”, a empresa não só enriquece a sua oferta ao consumidor, mas também demonstra o potencial de um fluxo de trabalho criativo totalmente integrado, consolidando a posição do Gemini como uma plataforma multimodal unificada.
Outros artigos interessantes:










