TecheNet
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS
Sem resultados
Ver todos os resultados
TecheNet
Sem resultados
Ver todos os resultados

DeepSeek lança IA que “vê” documentos para poupar recursos

Vitor Urbano por Vitor Urbano
21/10/2025
Em Inteligência Artificial

A inteligência artificial está a devorar quantidades massivas de dados, mas processar documentos gigantescos – relatórios financeiros de centenas de páginas, artigos científicos complexos, livros inteiros – continua a ser uma tarefa computacionalmente cara e lenta. A startup chinesa DeepSeek acredita ter encontrado uma solução engenhosa para este problema: acaba de lançar o DeepSeek-OCR, um novo modelo de IA que não se limita a ler texto; ele vê a página como um todo, usando essa perceção visual para comprimir a informação de forma radical.

Disponível em código aberto, esta nova abordagem multimodal promete reduzir drasticamente os recursos necessários para que as IAs compreendam documentos extensos, abrindo novas portas para a análise de informação em larga escala.

O problema dos “tokens”: porque é que os documentos grandes são tão caros para a IA?

Para entender a importância do DeepSeek-OCR, é preciso perceber como os grandes modelos de linguagem (LLMs) processam a informação. Eles não leem palavras como nós; eles dividem o texto em pequenas unidades chamadas “tokens”. Um documento longo pode facilmente conter milhões de tokens.

Processar todos estes tokens exige uma enorme quantidade de poder computacional e memória, o que se traduz em custos elevados e tempos de processamento longos. É por isso que muitos chatbots têm limites no tamanho dos documentos que conseguem analisar.

Deepseek ia

A solução da DeepSeek: usar os olhos em vez de apenas ler

A inovação do DeepSeek-OCR reside na sua abordagem multimodal. Em vez de simplesmente converter toda a página num mar de tokens de texto, o sistema usa a perceção visual como uma forma de compressão.

Funciona em duas fases:

  1. O Codificador Visual (DeepEncoder): Primeiro, a IA “olha” para a página inteira, identificando não só o texto, mas também a sua estrutura visual – onde estão os títulos, as tabelas, os gráficos, as fórmulas matemáticas, os diagramas.
  2. O Descodificador Inteligente (MoE): Com base nesta compreensão visual, o sistema consegue representar a informação de forma muito mais compacta. Em vez de enviar milhões de tokens de texto para o modelo de linguagem, ele envia um número muito menor de tokens que representam a estrutura visual e o conteúdo essencial.

Segundo a DeepSeek, este método permite reduzir o volume de texto (tokens) entre sete e vinte vezes. É uma compressão massiva que torna possível processar documentos enormes sem um aumento proibitivo nos custos ou no tempo.

Mais do que texto: compreender tabelas, fórmulas e diagramas

A grande vantagem de usar a visão não é apenas a compressão. O DeepSeek-OCR consegue interpretar o significado de elementos não textuais, como tabelas complexas, fórmulas matemáticas ou diagramas de fluxo.

Isto abre um leque de aplicações em áreas onde a informação visual é crucial:

  • Finanças: Análise automática de relatórios financeiros complexos, com tabelas e gráficos.
  • Investigação Científica: Extração de dados de artigos científicos, incluindo fórmulas e resultados experimentais.
  • Análise Documental: Processamento de documentos legais, contratos ou manuais técnicos que misturam texto com diagramas.

Desempenho impressionante e a aposta no código aberto

Nos testes divulgados pela empresa, o DeepSeek-OCR demonstrou a sua eficácia. Mesmo com taxas de compressão elevadas (inferiores a 10x), o modelo manteve uma precisão de reconhecimento de caracteres de 97%, superando outros modelos de OCR concorrentes.

Fiel à sua filosofia, a DeepSeek disponibilizou o modelo em código aberto nas plataformas Hugging Face e GitHub, permitindo que investigadores e empresas de todo o mundo possam usá-lo e contribuir para o seu desenvolvimento. Esta aposta na abertura faz parte da estratégia da empresa de Hangzhou de criar modelos de IA mais eficientes e acessíveis, seguindo os passos dos seus modelos anteriores focados em raciocínio (V3) e aprendizagem por reforço (R1).

O “elefante na sala”: a censura chinesa

A DeepSeek junta-se a outras gigantes chinesas como a Baidu, Tencent e Alibaba na vanguarda do desenvolvimento de IA de código aberto. No entanto, como salienta o artigo original do South China Morning Post, existe uma sombra que paira sobre estas inovações: as rigorosas regras de controlo de conteúdo impostas pelo governo chinês.

Especialistas alertam que estas regras, que obrigam os modelos de IA a censurar tópicos considerados sensíveis, podem limitar a adoção e a expansão internacional destes sistemas, mesmo que a sua tecnologia seja de ponta.

Ainda assim, o DeepSeek-OCR representa um avanço técnico notável. É uma demonstração de como a combinação de diferentes modalidades (visão e linguagem) pode levar a soluções de IA mais eficientes e poderosas, capazes de desbloquear o conhecimento escondido em milhões de documentos que, até agora, eram demasiado grandes para serem lidos pelas máquinas.

Outros artigos interessantes:

  • Android vs iOS: a batalha que divide o mundo (e o teu bolso)
  • Confirmado: OnePlus Ace 6 terá bateria de 7.800mAh e ecrã de 165Hz
  • Perdeste o Gmail? A Google tem 2 novas formas de te salvar
PartilhaTweetEnvia
Vitor Urbano

Vitor Urbano

Frequentou a licenciatura de Desporto em Setúbal e atualmente reside na Letónia. Apaixonado por novas tecnologias e fã do "pequeno" Android desde 2009.

Artigos relacionados

Deepseek ai
Inteligência Artificial

DeepSeek volta a atacar: novos modelos desafiam o GPT-5 e o Gemini 3 com “eficiência”

04/12/2025
Aws ai agents
Inteligência Artificial

AWS lança agentes de IA “mais humanos” que entendem tom e sotaque

02/12/2025
Linde mh, nvidia e accenture desenvolvem "armazém virtual" com ia
Empresas

Linde MH, NVIDIA e Accenture desenvolvem “armazém virtual” com IA

02/12/2025
Apple ai (2)
Apple

Apple recruta ex-líder do Google Gemini para salvar a sua IA

02/12/2025
Ucrânia desenvolve ia soberana baseada em google gemma
Inteligência Artificial

Ucrânia desenvolve IA soberana baseada em Google Gemma

02/12/2025
Google gemini aplicação móvel
Google

Google promete “revolução” na app do Gemini e confirma versão nativa para Mac

01/12/2025

Últimas notícias

Netflix - warner bros

Netflix compra Warner Bros. e HBO por 82.7 mil milhões de dólares

06/12/2025
Opera air

Opera Air: o ‘browser’ que te ensina a respirar e acalma a ansiedade digital

06/12/2025
Google messages whatsapp

Google Messages em dezembro: IA, segurança e o caminho para o iPhone

06/12/2025
QNAP

10 Bancos europeus criam Qivalis para lançar stablecoin indexada ao euro

AWS Graviton5: 192 núcleos e 25% mais rápido

BenQ PD2770U: monitor 4K com precisão de cor absoluta

DeepSeek volta a atacar: novos modelos desafiam o GPT-5 e o Gemini 3 com “eficiência”

Resident Evil Requiem: gameplay de combate revelado na TV japonesa

Metroid Prime 4 chegou: a despedida perfeita para a era da Nintendo Switch

Salários de 5.000€: a armadilha da Dark Web para jovens

Google Photos ganha retoque facial: mudar dentes e olhos chega em breve

QNAP e V-Valley Portugal assinam acordo para o mercado Enterprise

Honor quebra o silêncio: “Nenhum smartwatch mede a temperatura do corpo com precisão”

Amazfit T-Rex 3 Pro recebe atualização: BioCharge e navegação renovados

iPhone 17e: o modelo ‘barato’ ganha Ilha Dinâmica e ecrã OLED

Cloudflare trava o maior ataque DDoS da história da Internet

Samsung marca encontro para 4 de janeiro: IA e o TriFold global abrem a CES 2026

Infinix Note 60 Ultra: o primeiro ‘smartphone’ desenhado pela lendária Pininfarina

Google Discover usa IA para reescrever títulos e o resultado é desastroso

Motorola Edge 70 Ultra: imagens revelam novo design e um botão misterioso para IA

Techenet LOGO
  • Quem somos
  • Fale connosco, envie a sua pergunta aqui
  • Termos e condições
  • Política de comentários
  • Política de Privacidade
  • Política de Cookies
Sem resultados
Ver todos os resultados
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS

© 2025 JNews - Premium WordPress news & magazine theme by Jegtheme.