TecheNet
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS
Sem resultados
Ver todos os resultados
TecheNet
Sem resultados
Ver todos os resultados

DeepSeek lança IA que “vê” documentos para poupar recursos

Vitor Urbano por Vitor Urbano
21/10/2025
Em Inteligência Artificial

A inteligência artificial está a devorar quantidades massivas de dados, mas processar documentos gigantescos – relatórios financeiros de centenas de páginas, artigos científicos complexos, livros inteiros – continua a ser uma tarefa computacionalmente cara e lenta. A startup chinesa DeepSeek acredita ter encontrado uma solução engenhosa para este problema: acaba de lançar o DeepSeek-OCR, um novo modelo de IA que não se limita a ler texto; ele vê a página como um todo, usando essa perceção visual para comprimir a informação de forma radical.

Disponível em código aberto, esta nova abordagem multimodal promete reduzir drasticamente os recursos necessários para que as IAs compreendam documentos extensos, abrindo novas portas para a análise de informação em larga escala.

O problema dos “tokens”: porque é que os documentos grandes são tão caros para a IA?

Para entender a importância do DeepSeek-OCR, é preciso perceber como os grandes modelos de linguagem (LLMs) processam a informação. Eles não leem palavras como nós; eles dividem o texto em pequenas unidades chamadas “tokens”. Um documento longo pode facilmente conter milhões de tokens.

Processar todos estes tokens exige uma enorme quantidade de poder computacional e memória, o que se traduz em custos elevados e tempos de processamento longos. É por isso que muitos chatbots têm limites no tamanho dos documentos que conseguem analisar.

Deepseek ia

A solução da DeepSeek: usar os olhos em vez de apenas ler

A inovação do DeepSeek-OCR reside na sua abordagem multimodal. Em vez de simplesmente converter toda a página num mar de tokens de texto, o sistema usa a perceção visual como uma forma de compressão.

Funciona em duas fases:

  1. O Codificador Visual (DeepEncoder): Primeiro, a IA “olha” para a página inteira, identificando não só o texto, mas também a sua estrutura visual – onde estão os títulos, as tabelas, os gráficos, as fórmulas matemáticas, os diagramas.
  2. O Descodificador Inteligente (MoE): Com base nesta compreensão visual, o sistema consegue representar a informação de forma muito mais compacta. Em vez de enviar milhões de tokens de texto para o modelo de linguagem, ele envia um número muito menor de tokens que representam a estrutura visual e o conteúdo essencial.

Segundo a DeepSeek, este método permite reduzir o volume de texto (tokens) entre sete e vinte vezes. É uma compressão massiva que torna possível processar documentos enormes sem um aumento proibitivo nos custos ou no tempo.

Mais do que texto: compreender tabelas, fórmulas e diagramas

A grande vantagem de usar a visão não é apenas a compressão. O DeepSeek-OCR consegue interpretar o significado de elementos não textuais, como tabelas complexas, fórmulas matemáticas ou diagramas de fluxo.

Isto abre um leque de aplicações em áreas onde a informação visual é crucial:

  • Finanças: Análise automática de relatórios financeiros complexos, com tabelas e gráficos.
  • Investigação Científica: Extração de dados de artigos científicos, incluindo fórmulas e resultados experimentais.
  • Análise Documental: Processamento de documentos legais, contratos ou manuais técnicos que misturam texto com diagramas.

Desempenho impressionante e a aposta no código aberto

Nos testes divulgados pela empresa, o DeepSeek-OCR demonstrou a sua eficácia. Mesmo com taxas de compressão elevadas (inferiores a 10x), o modelo manteve uma precisão de reconhecimento de caracteres de 97%, superando outros modelos de OCR concorrentes.

Fiel à sua filosofia, a DeepSeek disponibilizou o modelo em código aberto nas plataformas Hugging Face e GitHub, permitindo que investigadores e empresas de todo o mundo possam usá-lo e contribuir para o seu desenvolvimento. Esta aposta na abertura faz parte da estratégia da empresa de Hangzhou de criar modelos de IA mais eficientes e acessíveis, seguindo os passos dos seus modelos anteriores focados em raciocínio (V3) e aprendizagem por reforço (R1).

O “elefante na sala”: a censura chinesa

A DeepSeek junta-se a outras gigantes chinesas como a Baidu, Tencent e Alibaba na vanguarda do desenvolvimento de IA de código aberto. No entanto, como salienta o artigo original do South China Morning Post, existe uma sombra que paira sobre estas inovações: as rigorosas regras de controlo de conteúdo impostas pelo governo chinês.

Especialistas alertam que estas regras, que obrigam os modelos de IA a censurar tópicos considerados sensíveis, podem limitar a adoção e a expansão internacional destes sistemas, mesmo que a sua tecnologia seja de ponta.

Ainda assim, o DeepSeek-OCR representa um avanço técnico notável. É uma demonstração de como a combinação de diferentes modalidades (visão e linguagem) pode levar a soluções de IA mais eficientes e poderosas, capazes de desbloquear o conhecimento escondido em milhões de documentos que, até agora, eram demasiado grandes para serem lidos pelas máquinas.

Outros artigos interessantes:

  • Android vs iOS: a batalha que divide o mundo (e o teu bolso)
  • Confirmado: OnePlus Ace 6 terá bateria de 7.800mAh e ecrã de 165Hz
  • Perdeste o Gmail? A Google tem 2 novas formas de te salvar
PartilhaTweetEnvia
Vitor Urbano

Vitor Urbano

Frequentou a licenciatura de Desporto em Setúbal e atualmente reside na Letónia. Apaixonado por novas tecnologias e fã do "pequeno" Android desde 2009.

Artigos relacionados

Excel agente ia
Inteligência Artificial

Excel ganha ‘Agente’ de IA no Windows e novas funções de texto em janeiro

28/01/2026
Bill gates nvidia ai
Inteligência Artificial

Bill Gates aposta em chip de IA movido a luz que pode destronar a Nvidia

27/01/2026
Chatgpt grok
Inteligência Artificial

ChatGPT apanhado a usar a ‘Grokipedia’ de Musk como fonte: a contaminação da verdade

26/01/2026
Chatgpt atlas
Inteligência Artificial

ChatGPT Atlas: o navegador da OpenAI ganha grupos de abas e pesquisa mista

23/01/2026
Google search ai
Google

Google Search agora lê os teus emails e fotos com Inteligência Pessoal

23/01/2026
Elon musk x
Inteligência Artificial

Musk perde batalha para obter código-fonte da OpenAI: juiz rejeita pedido “excessivo”

23/01/2026

Últimas notícias

Volvo_xc70 suv

Volvo desafia GM e promete: o Apple CarPlay fica para sempre

28/01/2026
Apple tv - pluribus

Apple TV+ soma 9 nomeações WGA: ‘Pluribus’ lidera a corrida aos prémios

28/01/2026
Samsung ecrã segurança

Galaxy S26: Samsung revela ecrã que esconde o teu PIN de quem está ao lado

28/01/2026
QNAP

Google reforça segurança: Android 16 ganha ‘bloqueio inteligente’ contra ladrões

Razer Synapse Web: configura o teu rato e teclado no browser sem instalar nada

Tim Cook fala com Trump após mortes do ICE: “É tempo de desescalada”

Xiaomi SU7 Ultra: supercarro elétrico chega ao Gran Turismo 7

Galaxy S26 Ultra: Samsung revela ecrã que “esconde” mensagens de quem está ao lado

Excel ganha ‘Agente’ de IA no Windows e novas funções de texto em janeiro

Risco interno em cibersegurança: perdas de dados em 77% das empresas

Huawei Mate 80 Pro Max coroado como o smartphone mais inteligente em cenários de IA

OPPO A6 Pro 5G chega a Portugal com foco na durabilidade

Huawei Watch GT 6 Pro ganha edição Honma com IA para golfistas exigentes

Relatório Adyen e BCG: tesouraria fragmentada tornou-se um ponto de bloqueio

Aluminium OS: Google deixa escapar o futuro do Android no PC

Alerta Google Pixel: atualização de janeiro mata Wi-Fi e Bluetooth

WhatsApp lança ‘Modo Bloqueio’ para travar ciberataques sofisticados

Toyota levanta o véu sobre novo SUV elétrico de 3 filas: o Highlander EV está a chegar?

Apple cede à pressão: preço da memória do iPhone dispara 100% em 2026

Tesla afunda na Europa enquanto os elétricos batem a gasolina pela primeira vez

Techenet LOGO
  • Quem somos
  • Fale connosco, envie a sua pergunta aqui
  • Termos e condições
  • Política de comentários
  • Política de Privacidade
  • Política de Cookies
Sem resultados
Ver todos os resultados
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS

© 2026 JNews - Premium WordPress news & magazine theme by Jegtheme.