O Google integrou o Lyria 3, o seu modelo de geração musical mais avançado, diretamente na aplicação Gemini, permitindo a qualquer utilizador criar faixas originais a partir de texto, fotografias ou vídeos. O lançamento expande as capacidades multimodais do Gemini e consolida a estratégia do Google em posicionar a sua plataforma de IA como hub criativo transversal, num mercado onde a competição no segmento de áudio generativo se intensifica.

Lyria 3: o modelo por detrás da funcionalidade
Desenvolvido pelo Google DeepMind, o Lyria 3 é o modelo de geração de áudio de última geração da empresa, treinado para produzir faixas musicais com qualidade de produção a partir de instruções em linguagem natural. A integração no Gemini elimina a barreira técnica que historicamente limitava o acesso a ferramentas de composição assistida por IA: o utilizador não necessita de conhecimentos musicais, teoria harmónica ou experiência com software de produção.
O processo de geração é multimodal. Uma fotografia, um vídeo ou uma simples descrição textual servem como ponto de partida para a criação de uma faixa de 30 segundos, com letra gerada automaticamente e capa personalizada. O resultado é imediato e partilhável, otimizado para o formato de conteúdo curto que domina as plataformas digitais.
Integração no ecossistema: do Gemini ao YouTube Shorts
A funcionalidade está disponível em gemini.google.com e na aplicação móvel Gemini, mas a sua integração mais estratégica ocorre no YouTube Dream Track. Os criadores de YouTube Shorts podem aceder ao Lyria 3 para produzir bandas sonoras originais para os seus vídeos, sem recorrer a bibliotecas de música licenciada ou a acordos com editoras.
Esta ligação ao YouTube não é acidental. O Google está a consolidar o Lyria 3 como infrastrutура criativa transversal ao seu ecossistema: a mesma tecnologia que serve o utilizador casual no Gemini alimenta o criador de conteúdo profissional no YouTube, reforçando a proposta de valor de ambas as plataformas sem fragmentar o desenvolvimento do modelo.
SynthID: rastreabilidade como resposta às preocupações de autoria
Todas as faixas geradas pelo Lyria 3 incorporam SynthID, o sistema de marca de água desenvolvido pelo Google DeepMind para conteúdo gerado por IA. A marca é imperceptível ao ouvido humano, mas detetável por ferramentas especializadas, permitindo identificar a origem artificial do conteúdo mesmo após compressão, conversão de formato ou re-partilha.
O Google sublinha ter adotado uma abordagem cuidadosa em relação aos direitos de autor no treino do Lyria 3, com parcerias estabelecidas com artistas e editoras. Contudo, os termos específicos dessas parcerias não foram divulgados. O próprio Google reconhece que o SynthID “pode não ser infalível” – uma admissão relevante num contexto em que a rastreabilidade de conteúdo sintético é cada vez mais exigida por reguladores europeus no âmbito do AI Act.
Posicionamento competitivo: Google num mercado em disputa
O lançamento do Lyria 3 insere-se num segmento em rápida maturação. A OpenAI tem desenvolvido capacidades de áudio generativo integradas no ecossistema ChatGPT, a Meta disponibilizou o AudioCraft como modelo de código aberto, e startups como a Suno e a Udio oferecem geração musical a partir de texto com faixas de duração superior. Face a este quadro competitivo, a vantagem da Google reside menos na exclusividade técnica do Lyria 3 e mais na distribuição: a integração nativa no Gemini e no YouTube confere ao modelo uma escala de adoção imediata que nenhum concorrente independente consegue replicar.
| Plataforma | Modelo | Duração máxima | Integração nativa |
|---|---|---|---|
| Google Gemini | Lyria 3 | 30 segundos | Gemini + YouTube Shorts |
| OpenAI | EM desenvolvimento | N/D | ChatGPT |
| Meta | AudioCraft (open-source) | Variável | Não |
| Suno | Suno v4 | Até 4 minutos | Standalone |
| Udio | Udio v2 | Até 3 minutos | Standalone |
Limitações técnicas e interrogações em aberto
O limite de 30 segundos por faixa é a restrição mais imediata para qualquer uso criativo além do entretenimento casual ou da produção de conteúdo para Shorts. O Google não indicou um calendário para o alargamento dessa duração. A disponibilidade geográfica do Dream Track para YouTube mantém-se assimétrica, com expansão progressiva fora dos Estados Unidos – o que coloca os criadores de outros mercados em desvantagem competitiva face aos seus congéneres americanos.
A questão dos direitos de autor permanece a mais complexa. A ausência de transparência sobre os dados de treino do Lyria 3 e os termos das parcerias com a indústria musical é um ponto de vulnerabilidade regulatória, em particular na União Europeia, onde o AI Act impõe obrigações crescentes de transparência sobre os modelos de IA de uso geral.
Implicações: criatividade democratizada ou dependência de plataforma?
A integração do Lyria 3 no Gemini é tecnicamente sólida e estrategicamente coerente com a visão do Google para a IA multimodal. Para o utilizador comum, representa um acesso genuinamente novo a ferramentas de expressão criativa. Para o criador de conteúdo profissional, oferece uma alternativa viável às bibliotecas de música licenciada.
A interrogação estrutural é outra: à medida que a criação musical migra para plataformas de IA proprietárias, a dependência dos criadores em relação ao ecossistema do fornecedor aprofunda-se. O Google controla o modelo, a plataforma de distribuição e o sistema de rastreabilidade. É uma convergência vertical que simplifica o fluxo criativo, mas concentra poder numa única entidade – com todas as implicações que isso acarreta para a autonomia dos criadores e para a diversidade do ecossistema musical digital.
Para mais informações, lê o artigo publicado no Google Blog Portugal.
Já disponível em Português para utilizadores (+18) na app Gemini.
Outros artigos interessantes:










