TecheNet
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS
Sem resultados
Ver todos os resultados
TecheNet
Sem resultados
Ver todos os resultados

NVIDIA impulsiona a inferência no Meta Llama 3

Alfredo Beleza por Alfredo Beleza
20/04/2024
Em Inteligência Artificial

A NVIDIA anunciou, nodia 18 de abril, otimizações em todas as suas plataformas para acelerar o Meta Llama 3, a mais recente geração do grande modelo de linguagem (LLM) da Meta.

A colaboração entre as duas empresas tem o intuito democratizar o acesso à inteligência artificial de ponta, permitindo que desenvolvedores, pesquisadores e empresas de todos os portes explorem o potencial dessa tecnologia numa ampla gama de aplicações.

Nvidia impulsiona a inferência no meta llama 3

Treinado com poder NVIDIA

O Meta Llama 3 foi treinado em clusters de computadores com 24.576 GPUs NVIDIA H100 Tensor Core, conectados com redes RoCE e NVIDIA Quantum-2 InfiniBand.

Com o apoio da NVIDIA, a Meta ajustou sua rede, software e arquiteturas de modelo para otimizar o desempenho do LLM. A empresa planeia escalar ainda mais sua infraestrutura para 350.000 GPUs H100, impulsionando ainda mais o desenvolvimento da IA generativa.

Meta Llama 3 em ação: Do cloud computing aos dispositivos móveis

Versões do Meta Llama 3 aceleradas por GPUs NVIDIA estão disponíveis para uso em diversos ambientes: nuvem, data centers, dispositivos de borda e até mesmo PCs.

  • Nuvem: Desenvolvedores podem experimentar o Llama 3 na nuvem através da plataforma ai.nvidia.com. O modelo é empacotado como um microsserviço NVIDIA NIM com interface de programação de aplicações padrão, facilitando sua implantação em qualquer lugar.
  • Data centers: Empresas podem personalizar o Llama 3 com seus próprios dados usando o NVIDIA NeMo, um framework de código aberto para LLMs que faz parte da plataforma NVIDIA AI Enterprise. Modelos personalizados podem ser otimizados para inferência com o TensorRT-LLM da NVIDIA e implantados com o Triton Inference Server.
  • Dispositivos de borda: O Meta Llama 3 também funciona no NVIDIA Jetson Orin, ideal para aplicações de robótica e computação de borda, possibilitando a criação de agentes interativos como os do Jetson AI Lab.
  • PCs: GPUs NVIDIA RTX e GeForce RTX para estações de trabalho e PCs também aceleram a inferência no Llama 3, oferecendo aos desenvolvedores um vasto alcance de mais de 100 milhões de sistemas acelerados pela NVIDIA em todo o mundo.

Desempenho otimizado para diferentes necessidades

O desempenho ideal do Meta Llama 3 varia de acordo com a aplicação. Para um chatbot, por exemplo, é crucial equilibrar baixa latência, alta velocidade de leitura e uso eficiente da GPU para reduzir custos.

Em testes iniciais, uma única GPU NVIDIA H200 Tensor Core gerou cerca de 3.000 tokens/segundo (o equivalente aproximado de palavras para um LLM) – suficiente para atender cerca de 300 utilizadores simultâneos – na versão do Llama 3 com 70 biliões de parâmetros. Isso significa que um único servidor NVIDIA HGX com oito GPUs H200 poderia suportar mais de 2.400 utilizadores em simultâneo.

Para dispositivos de borda, a versão do Llama 3 com oito biliõess de parâmetros gerou até 40 tokens/segundo no Jetson AGX Orin e 15 tokens/segundo no Jetson Orin Nano.

Compromisso com a comunidade de código aberto

A NVIDIA, como contribuidora ativa de código aberto, está comprometida em otimizar o software da comunidade para auxiliar os utilizadores nos seus desafios. Modelos de código aberto promovem a transparência na IA e permitem que os utilizadores partilhem os seus trabalhos sobre segurança e resiliência da IA.

Comentário do Diretor da NVIDIA para América Latina

Estamos entusiasmados em oferecer mais essa tecnologia de IA da NVIDIA para impulsionar a inovação. Com o Meta Llama 3 otimizado para nossas GPUs, estamos capacitando desenvolvedores e empresas a explorar todo o potencial da inteligência artificial em uma variedade de aplicações, desde a nuvem até dispositivos de borda.

Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina

Conclusão:

A colaboração entre NVIDIA e Meta representa um passo importante na democratização da inteligência artificial, tornando essa tecnologia acessível a um público mais amplo e impulsionando o desenvolvimento de novas soluções inovadoras em diversos setores.

Para mais informações leia este artigo publicado no blog da NVIDIA

Outros artigos interessantes:

  • DJI aposta forte nas suas centrais de energia: portas inteligentes para mais opções
  • Xiaomi 13T Pro com 512GB a preço imbatível: Uma oportunidade imperdível!
  • NOVA FCT coordena projeto ALERT-PFAS
PartilhaTweetEnvia
Alfredo Beleza

Alfredo Beleza

Gestor de empresas, “blogger” e designer. Com uma carreira marcada por experiências internacionais, foi diretor de marketing/comercial em empresas na Suiça e no Brasil. É co-fundador do site de notícias TecheNet, onde partilha a sua paixão pelo mundo da tecnologia.

Artigos relacionados

Riscos da ia generativa disparam em ambientes corporativos
Segurança

Riscos da IA generativa disparam em ambientes corporativos

11/07/2025
Youtube
YouTube

YouTube prepara-se para travar conteúdos gerados por IA de baixa qualidade

10/07/2025
Cloudflare google
Google

Cloudflare desafia Google e propõe mudanças no acesso a conteúdos para IA

10/07/2025
Grok
Inteligência Artificial

Grok, a IA de Elon Musk, volta a ser criticada por comentários antissemitas

09/07/2025
Google gemini arco-íris
Google

O Google Gemini tem um novo visual e diz olá ao arco-íris

02/07/2025
Google gemini ipad
Google

A tua privacidade no Gemini está prestes a ser reforçada

02/07/2025

Promoções interessantes

Samsung galaxy a26
Promoções

Este Samsung tem um desconto de 110€ e suporte para 6 anos

06/07/2025
Apple macbook air m4 (4)
Promoções

Promoção: MacBook de 1000 euros é a escolha ideal para estudantes

04/07/2025
Sharp ht-sb110 sound bar
Promoções

Som de cinema por 50 euros: a barra de som que a tua TV precisa

04/07/2025
QNAP

Mobilidade Elétrica

Volkswagen id. Every1 (4)

Carros elétricos já são 73% mais limpos do que modelos a gasolina

por Vitor Urbano
10/07/2025

A mobilidade elétrica na Europa está a dar passos largos na luta contra as alterações climáticas. Um novo relatório do...

Duotts f26 - bicicleta elétrica - análise - techenet (2)

Debate sobre bicicletas elétricas mais potentes aquece na Europa

por Vitor Urbano
09/07/2025

O panorama das bicicletas elétricas na Europa pode estar prestes a mudar de forma significativa. Atualmente, os utilizadores europeus estão...

Volvo camiões elétricos

A Volvo já entregou 5000 camiões elétricos e está a deixar a Tesla para trás

por Vitor Urbano
30/06/2025

Enquanto a Tesla Semi tem capturado as manchetes desde a sua primeira aparição em 2017, a Volvo Trucks tem trabalhado...

Manutenção de trotinete elétrica: 7 dicas da niu para o verão

Manutenção de trotinete elétrica: 7 dicas da NIU para o verão

por Alfredo Beleza
28/06/2025

A crescente adesão à micromobilidade em Portugal torna as trotinetes elétricas um veículo de eleição para deslocações urbanas. Com a...

Guias Techenet

Transforma o teu tablet: os melhores teclados bluetooth em 2025

Portáteis até 200 euros: Guia para encontrares o ideal em 2025

A revolução dos ecrãs AMOLED em smartphones baratos: vê os melhores!

Explorando as melhores ferramentas tecnológicas para aprender inglês online

Cartório: Conheça Seus Diferentes Tipos, Funções e Serviços

Registar a sua Marca em Portugal

Como realizar a recuperação de dados de um conjunto RAID Synology quebrado?

Techenet LOGO
  • Quem somos
  • Fale connosco, envie a sua pergunta aqui
  • Termos e condições
  • Política de comentários
  • Política de Privacidade
  • Política de Cookies
Sem resultados
Ver todos os resultados
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS

© 2025 JNews - Premium WordPress news & magazine theme by Jegtheme.