TecheNet
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS
Sem resultados
Ver todos os resultados
TecheNet
Sem resultados
Ver todos os resultados

DeepSeek lança IA que “vê” documentos para poupar recursos

Vitor Urbano por Vitor Urbano
21/10/2025
Em Inteligência Artificial

A inteligência artificial está a devorar quantidades massivas de dados, mas processar documentos gigantescos – relatórios financeiros de centenas de páginas, artigos científicos complexos, livros inteiros – continua a ser uma tarefa computacionalmente cara e lenta. A startup chinesa DeepSeek acredita ter encontrado uma solução engenhosa para este problema: acaba de lançar o DeepSeek-OCR, um novo modelo de IA que não se limita a ler texto; ele vê a página como um todo, usando essa perceção visual para comprimir a informação de forma radical.

Disponível em código aberto, esta nova abordagem multimodal promete reduzir drasticamente os recursos necessários para que as IAs compreendam documentos extensos, abrindo novas portas para a análise de informação em larga escala.

O problema dos “tokens”: porque é que os documentos grandes são tão caros para a IA?

Para entender a importância do DeepSeek-OCR, é preciso perceber como os grandes modelos de linguagem (LLMs) processam a informação. Eles não leem palavras como nós; eles dividem o texto em pequenas unidades chamadas “tokens”. Um documento longo pode facilmente conter milhões de tokens.

Processar todos estes tokens exige uma enorme quantidade de poder computacional e memória, o que se traduz em custos elevados e tempos de processamento longos. É por isso que muitos chatbots têm limites no tamanho dos documentos que conseguem analisar.

Deepseek ia

A solução da DeepSeek: usar os olhos em vez de apenas ler

A inovação do DeepSeek-OCR reside na sua abordagem multimodal. Em vez de simplesmente converter toda a página num mar de tokens de texto, o sistema usa a perceção visual como uma forma de compressão.

Funciona em duas fases:

  1. O Codificador Visual (DeepEncoder): Primeiro, a IA “olha” para a página inteira, identificando não só o texto, mas também a sua estrutura visual – onde estão os títulos, as tabelas, os gráficos, as fórmulas matemáticas, os diagramas.
  2. O Descodificador Inteligente (MoE): Com base nesta compreensão visual, o sistema consegue representar a informação de forma muito mais compacta. Em vez de enviar milhões de tokens de texto para o modelo de linguagem, ele envia um número muito menor de tokens que representam a estrutura visual e o conteúdo essencial.

Segundo a DeepSeek, este método permite reduzir o volume de texto (tokens) entre sete e vinte vezes. É uma compressão massiva que torna possível processar documentos enormes sem um aumento proibitivo nos custos ou no tempo.

Mais do que texto: compreender tabelas, fórmulas e diagramas

A grande vantagem de usar a visão não é apenas a compressão. O DeepSeek-OCR consegue interpretar o significado de elementos não textuais, como tabelas complexas, fórmulas matemáticas ou diagramas de fluxo.

Isto abre um leque de aplicações em áreas onde a informação visual é crucial:

  • Finanças: Análise automática de relatórios financeiros complexos, com tabelas e gráficos.
  • Investigação Científica: Extração de dados de artigos científicos, incluindo fórmulas e resultados experimentais.
  • Análise Documental: Processamento de documentos legais, contratos ou manuais técnicos que misturam texto com diagramas.

Desempenho impressionante e a aposta no código aberto

Nos testes divulgados pela empresa, o DeepSeek-OCR demonstrou a sua eficácia. Mesmo com taxas de compressão elevadas (inferiores a 10x), o modelo manteve uma precisão de reconhecimento de caracteres de 97%, superando outros modelos de OCR concorrentes.

Fiel à sua filosofia, a DeepSeek disponibilizou o modelo em código aberto nas plataformas Hugging Face e GitHub, permitindo que investigadores e empresas de todo o mundo possam usá-lo e contribuir para o seu desenvolvimento. Esta aposta na abertura faz parte da estratégia da empresa de Hangzhou de criar modelos de IA mais eficientes e acessíveis, seguindo os passos dos seus modelos anteriores focados em raciocínio (V3) e aprendizagem por reforço (R1).

O “elefante na sala”: a censura chinesa

A DeepSeek junta-se a outras gigantes chinesas como a Baidu, Tencent e Alibaba na vanguarda do desenvolvimento de IA de código aberto. No entanto, como salienta o artigo original do South China Morning Post, existe uma sombra que paira sobre estas inovações: as rigorosas regras de controlo de conteúdo impostas pelo governo chinês.

Especialistas alertam que estas regras, que obrigam os modelos de IA a censurar tópicos considerados sensíveis, podem limitar a adoção e a expansão internacional destes sistemas, mesmo que a sua tecnologia seja de ponta.

Ainda assim, o DeepSeek-OCR representa um avanço técnico notável. É uma demonstração de como a combinação de diferentes modalidades (visão e linguagem) pode levar a soluções de IA mais eficientes e poderosas, capazes de desbloquear o conhecimento escondido em milhões de documentos que, até agora, eram demasiado grandes para serem lidos pelas máquinas.

Outros artigos interessantes:

  • Android vs iOS: a batalha que divide o mundo (e o teu bolso)
  • Confirmado: OnePlus Ace 6 terá bateria de 7.800mAh e ecrã de 165Hz
  • Perdeste o Gmail? A Google tem 2 novas formas de te salvar
PartilhaTweetEnvia
Vitor Urbano

Vitor Urbano

Frequentou a licenciatura de Desporto em Setúbal e atualmente reside na Letónia. Apaixonado por novas tecnologias e fã do "pequeno" Android desde 2009.

Artigos relacionados

Novo modelo operacional de ia da ibm anunciado no think 2026
Inteligência Artificial

Novo modelo operacional de IA da IBM anunciado no Think 2026

09/05/2026
Claude opus 4. 5: novo padrão para engenharia de software
Inteligência Artificial

Acordo com SpaceX: Claude Code duplica os seus limites de uso

08/05/2026
Sam altman - open ai - new york times - chatgpt
Inteligência Artificial

Caos na OpenAI: Ex-diretora expõe as táticas manipuladoras de Sam Altman

08/05/2026
Google escritórios
Google

Conhece o Remy, o agente da Google que vai trabalhar por ti

08/05/2026
Microsoft xbox ai
Microsoft

Microsoft desiste do Copilot na Xbox: os jogadores tinham razão

06/05/2026
Gpt-5. 5 instant, o novo modelo padrão do chatgpt com menos alucinações e memória auditável
Inteligência Artificial

GPT-5.5 Instant é o novo modelo padrão do ChatGPT

06/05/2026

Últimas notícias

Smartphone xiaomi com interface hyperos 4 liquid glass ligado ao ecossistema de automóvel e casa inteligente

HyperOS 4: o que se sabe, o que se especula e quando pode chegar a Portugal

10/05/2026
Xiaomi hyperos 3 (2)

A Xiaomi não deitou o teu telemóvel antigo para o lixo: nova atualização

10/05/2026
Dexter - resurrection

Dexter: Resurrection temporada 2: tudo o que sabemos sobre o regresso

10/05/2026

HONOR 600: câmara de 200MP e bateria de 6.400mAh em Portugal

Lenovo Legion Y70: Fuga revela nova besta gaming com bateria de 8.000 mAh

Novo modelo operacional de IA da IBM anunciado no Think 2026

A IA vai dominar o mundo, mas não como nos filmes

Huawei ultrapassa os 24 milhões de relógios vendidos e ataca com o Watch Fit 5

Huawei Watch Kids X1: segurança e câmaras de topo para o pulso das crianças

DJI Osmo Mobile 8P chega ao mercado com ecrã remoto para criadores a solo

Samsung prepara ecrãs holográficos: o futuro nos teus dedos

Receitas da Fortinet crescem 20% no primeiro trimestre de 2026

Acordo com SpaceX: Claude Code duplica os seus limites de uso

Caos na OpenAI: Ex-diretora expõe as táticas manipuladoras de Sam Altman

Bowers & Wilkins Px8 S2 ganham novos acabamentos premium

A Xiaomi acaba de libertar o OmniVoice e o mundo vai passar a falar a tua língua

Conhece o Remy, o agente da Google que vai trabalhar por ti

Novos Snapdragon: o salto gigante para os telemóveis acessíveis

AirTags seguras: a Energizer criou a bateria que pinta línguas

Mudança radical na Samsung pode baratear os próximos dobráveis

Techenet LOGO
  • Quem somos
  • Fale connosco
  • Termos e condições
  • Política de comentários
  • Política de Privacidade
  • Política de Cookies
  • O uso de IA no TecheNet
Sem resultados
Ver todos os resultados
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS

© 2026 JNews - Premium WordPress news & magazine theme by Jegtheme.