A DeepSeek, empresa chinesa dedicada à inteligência artificial, poderá estar prestes a lançar um novo modelo de IA chamado R2, recorrendo exclusivamente aos processadores Ascend 910B da Huawei. A informação foi divulgada pelo blogger Deedydas na plataforma X, despertando a curiosidade da comunidade tecnológica sobre as capacidades deste novo sistema.
Segundo os dados partilhados, o R2 deverá integrar uma arquitetura híbrida baseada em MoE (Mixture of Experts), utilizando um mecanismo de seleção avançado e camadas densas, desenhadas para otimizar a gestão de cargas de trabalho de IA de alta complexidade. Esta inovação poderá representar um salto significativo face ao seu antecessor, o DeepSeek R1.

Além disso, o DeepSeek R2 poderá contar com cerca de 1,2 biliões de parâmetros — o dobro da versão anterior — o que sugere um aumento notável no desempenho e na capacidade de processamento. Um dos aspetos mais surpreendentes é o custo previsto da utilização deste modelo: estima-se que seja 97,3% mais económico do que o GPT-4, apresentando valores de 0,07€ por milhão de tokens de entrada e 0,27€ por milhão de tokens de saída, tornando-o uma proposta extremamente apelativa para utilização empresarial.
Dependência total de recursos locais reforça posição da DeepSeek
Outro dado relevante prende-se com a dependência da DeepSeek em relação aos próprios recursos locais. O modelo R2 terá sido treinado quase integralmente nos processadores Ascend 910B, alcançando uma impressionante taxa de utilização de 82% da capacidade dos mesmos. Com um desempenho de 512 PetaFLOPS de precisão FP16, esta aposta demonstra a confiança da empresa nos componentes nacionais para desenvolver soluções de alto nível.
O treino do modelo terá envolvido um volume de dados de 5,2 petabytes, e os primeiros resultados indicam pontuações de excelência, como 89,7% no teste C-Eval 2.0 e 92,4% em visão computacional no benchmark COCO.
Recorde-se que a DeepSeek já tinha lançado o modelo R1 no início deste ano, também utilizando os chips Ascend 910B da Huawei. Na altura, o foco esteve em três pilares essenciais: acessibilidade de preços, filosofia open-source e elevada eficiência. Agora, com o R2, a empresa parece querer elevar ainda mais a fasquia.
Informação ainda não confirmada oficialmente
É importante salientar que todas estas informações são, para já, baseadas em rumores, e não existe confirmação oficial por parte da DeepSeek ou da Huawei. Apesar disso, a possibilidade de um modelo com estas características surgir no mercado torna o cenário da inteligência artificial ainda mais interessante e competitivo.
Caso se venham a confirmar, estas novidades poderão mudar a forma como os utilizadores, especialmente no setor empresarial, acedem e integram soluções de IA nos seus processos, beneficiando de modelos mais potentes a custos substancialmente reduzidos.
Resta agora aguardar por anúncios oficiais que possam esclarecer todos os detalhes sobre o aguardado DeepSeek R2.
Outros artigos interessantes: