A Google acaba de dar um passo de gigante na expansão das capacidades da sua inteligência artificial. Se até agora utilizavas o Gemini principalmente para redigir textos, organizar a tua agenda ou analisar dados, prepara-te para uma mudança de ritmo: a partir de hoje, a aplicação já consegue transformar as tuas ideias e até as tuas fotografias em faixas de música personalizadas.
Esta nova funcionalidade, que chega em fase beta, promete mudar a forma como interagimos com a criação sonora no dia a dia. Não se trata apenas de pedir à IA que componha algo abstrato; a integração é profunda e permite que uses o contexto da tua vida para gerar áudio.
A tecnologia por trás do ritmo: Lyria 3 e Nano Banana
Para tornar isto possível, a Google recorreu ao Lyria 3, o modelo de geração musical mais avançado desenvolvido pela DeepMind. Este motor é o responsável por interpretar os teus pedidos e transformá-los em faixas com cerca de 30 segundos. Mas a experiência não fica pelo som. Sempre que geras uma música, a ferramenta Nano Banana entra em ação para criar automaticamente uma capa artística que ilustra a composição, oferecendo um pacote visual e sonoro completo.
O funcionamento é bastante intuitivo. Podes simplesmente escrever uma frase descrevendo um género musical, um estado de espírito ou uma memória específica. No entanto, a verdadeira magia acontece quando decides ir mais longe: podes carregar uma fotografia ou um vídeo e pedir ao Gemini que se inspire nesse conteúdo visual para compor a melodia. Imagina tirar uma foto a um pôr do sol e, segundos depois, teres uma banda sonora que capta exatamente essa “vibe”.
Letras automáticas e estilos personalizados
Um dos pontos de maior destaque é que não precisas de ser um compositor ou sequer de saber escrever rimas. O Gemini encarrega-se de gerar as letras de forma automática, integrando-as na composição se assim o desejares. Quer estejas à procura de um instrumental calmo para estudar ou de uma canção com voz para partilhar uma piada interna com os teus amigos, o sistema adapta-se ao teu pedido.
Embora a Google sublinhe que o objetivo não é criar obras-primas musicais para ganhar prémios, a qualidade do Lyria 3 permite uma expressão pessoal muito acima do que tínhamos visto até agora em ferramentas de consumo rápido. É uma forma lúdica e imediata de dares som aos teus pensamentos.
Ética e proteção de direitos de autor
Com o avanço da IA generativa no campo das artes, as questões sobre direitos de autor estão na ordem do dia. A Google parece ter aprendido com os desafios do setor e implementou o SynthID. Trata-se de uma marca de água impercetível ao ouvido humano, mas que permite identificar qualquer conteúdo como tendo sido gerado pela inteligência artificial da marca.
Além disso, a tecnológica assegura que o sistema foi desenhado para a expressão original e não para imitar artistas existentes. Se tentares pedir uma música “no estilo de” um cantor famoso, o Gemini utilizará essa referência apenas como uma inspiração criativa ampla, evitando criar uma cópia direta da voz ou dos arranjos característicos desse artista. Existem filtros ativos que comparam o resultado final com conteúdos protegidos para evitar plágio acidental.

Disponibilidade e acesso em Portugal
A boa notícia para os utilizadores nacionais é que o Português faz parte do lote inicial de idiomas suportados nesta fase de lançamento, a par do Inglês, Alemão, Espanhol, Francês, Hindi, Japonês e Coreano.
Para começares a criar as tuas faixas, precisas de ter mais de 18 anos e utilizar a aplicação Gemini. Embora a funcionalidade seja gratuita para todos, quem subscrever os planos Google AI Plus, Pro ou Ultra terá limites de utilização mais alargados, permitindo gerar um maior número de faixas diariamente sem restrições de tempo.
Este lançamento coloca a Google numa posição de vantagem na corrida pelas ferramentas criativas multimodais. Já não se trata apenas de ver e ler, mas sim de ouvir o que a inteligência artificial tem para te oferecer.
Outros artigos interessantes:








