A Google DeepMind revelou o Project Genie, um protótipo de investigação que permite aos utilizadores criar, explorar e modificar mundos interativos através de comandos de texto ou imagens. Alimentado pelo novo modelo Genie 3, o sistema gera ambientes navegáveis em tempo real e simula a física e as interações dinâmicas.
O acesso ao protótipo começou a ser disponibilizado para subscritores do Google AI Ultra nos Estados Unidos, o que marca um avanço significativo na procura por sistemas de IA que compreendam a dinâmica do mundo real.
O salto para os Modelos de Mundo
Um modelo de mundo simula a dinâmica de um ambiente ao prever a sua evolução e a forma como as ações o afetam. Embora a Google DeepMind tenha um histórico de agentes para ambientes específicos, como Xadrez ou Go, a construção de uma Inteligência Artificial Geral (AGI) exige sistemas que naveguem na diversidade do mundo real.
O Genie 3 distingue-se de outras experiências por gerar o caminho à frente em tempo real, à medida que o utilizador se move e interage com o espaço. Esta consistência permite a simulação de diversos cenários, desde a robótica e animação até à exploração de locais históricos e ficção.
Funcionalidades do Project Genie
O protótipo funciona como uma aplicação web que utiliza o Genie 3 em conjunto com o Nano Banana Pro e o Gemini. A experiência centra-se em três capacidades principais:
- Esboço de Mundos (World Sketching): Através de texto ou do carregamento de imagens, o utilizador cria um ambiente vivo. É possível definir a perspetiva (primeira ou terceira pessoa) e modificar imagens para ajustar o cenário antes de entrar nele.
- Exploração de Mundos (World Exploration): O ambiente gerado é totalmente navegável. O Project Genie cria o percurso de forma dinâmica com base nas ações tomadas pelo utilizador, permitindo ainda o ajuste da câmara durante a travessia.
- Remistura de Mundos (World Remixing): É possível interpretar mundos existentes de formas novas através da alteração dos comandos originais (prompts). Os utilizadores podem explorar criações curadas na galeria para obter inspiração e descarregar vídeos das suas explorações.
Limitações e responsabilidade na IA
O Project Genie permanece como um protótipo experimental no Google Labs. Por ser um modelo de investigação precoce, a Google DeepMind aponta áreas que necessitam de melhoria:
| Área de Melhoria | Descrição da Limitação Atual |
| Realismo | Os mundos gerados podem não ser totalmente fiéis à realidade ou à física real. |
| Controlo | As personagens podem apresentar latência ou ser mais difíceis de controlar. |
| Duração | As gerações estão atualmente limitadas a um máximo de 60 segundos. |
Algumas capacidades anunciadas anteriormente para o Genie 3, como eventos desencadeados por comandos que alteram o mundo durante a exploração, ainda não constam neste protótipo.
Perguntas Frequentes (FAQ):
O que torna o Project Genie diferente de um videojogo comum?
Ao contrário de um videojogo tradicional onde os cenários são pré-programados, o Genie gera o ambiente de forma dinâmica e “imaginada” em tempo real com base na interação do utilizador.
Quem pode aceder ao Project Genie atualmente?
O acesso está restrito a subscritores adultos do Google AI Ultra residentes nos Estados Unidos, com planos para expansão para outros territórios futuramente.
Posso partilhar as minhas criações?
Sim, o protótipo permite descarregar vídeos dos mundos criados e das respetivas explorações.
Outros artigos interessantes:










