TecheNet
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS
Sem resultados
Ver todos os resultados
TecheNet
Sem resultados
Ver todos os resultados

DeepSeek lança IA que “vê” documentos para poupar recursos

Vitor Urbano por Vitor Urbano
21/10/2025
Em Inteligência Artificial

A inteligência artificial está a devorar quantidades massivas de dados, mas processar documentos gigantescos – relatórios financeiros de centenas de páginas, artigos científicos complexos, livros inteiros – continua a ser uma tarefa computacionalmente cara e lenta. A startup chinesa DeepSeek acredita ter encontrado uma solução engenhosa para este problema: acaba de lançar o DeepSeek-OCR, um novo modelo de IA que não se limita a ler texto; ele vê a página como um todo, usando essa perceção visual para comprimir a informação de forma radical.

Disponível em código aberto, esta nova abordagem multimodal promete reduzir drasticamente os recursos necessários para que as IAs compreendam documentos extensos, abrindo novas portas para a análise de informação em larga escala.

O problema dos “tokens”: porque é que os documentos grandes são tão caros para a IA?

Para entender a importância do DeepSeek-OCR, é preciso perceber como os grandes modelos de linguagem (LLMs) processam a informação. Eles não leem palavras como nós; eles dividem o texto em pequenas unidades chamadas “tokens”. Um documento longo pode facilmente conter milhões de tokens.

Processar todos estes tokens exige uma enorme quantidade de poder computacional e memória, o que se traduz em custos elevados e tempos de processamento longos. É por isso que muitos chatbots têm limites no tamanho dos documentos que conseguem analisar.

Deepseek ia

A solução da DeepSeek: usar os olhos em vez de apenas ler

A inovação do DeepSeek-OCR reside na sua abordagem multimodal. Em vez de simplesmente converter toda a página num mar de tokens de texto, o sistema usa a perceção visual como uma forma de compressão.

Funciona em duas fases:

  1. O Codificador Visual (DeepEncoder): Primeiro, a IA “olha” para a página inteira, identificando não só o texto, mas também a sua estrutura visual – onde estão os títulos, as tabelas, os gráficos, as fórmulas matemáticas, os diagramas.
  2. O Descodificador Inteligente (MoE): Com base nesta compreensão visual, o sistema consegue representar a informação de forma muito mais compacta. Em vez de enviar milhões de tokens de texto para o modelo de linguagem, ele envia um número muito menor de tokens que representam a estrutura visual e o conteúdo essencial.

Segundo a DeepSeek, este método permite reduzir o volume de texto (tokens) entre sete e vinte vezes. É uma compressão massiva que torna possível processar documentos enormes sem um aumento proibitivo nos custos ou no tempo.

Mais do que texto: compreender tabelas, fórmulas e diagramas

A grande vantagem de usar a visão não é apenas a compressão. O DeepSeek-OCR consegue interpretar o significado de elementos não textuais, como tabelas complexas, fórmulas matemáticas ou diagramas de fluxo.

Isto abre um leque de aplicações em áreas onde a informação visual é crucial:

  • Finanças: Análise automática de relatórios financeiros complexos, com tabelas e gráficos.
  • Investigação Científica: Extração de dados de artigos científicos, incluindo fórmulas e resultados experimentais.
  • Análise Documental: Processamento de documentos legais, contratos ou manuais técnicos que misturam texto com diagramas.

Desempenho impressionante e a aposta no código aberto

Nos testes divulgados pela empresa, o DeepSeek-OCR demonstrou a sua eficácia. Mesmo com taxas de compressão elevadas (inferiores a 10x), o modelo manteve uma precisão de reconhecimento de caracteres de 97%, superando outros modelos de OCR concorrentes.

Fiel à sua filosofia, a DeepSeek disponibilizou o modelo em código aberto nas plataformas Hugging Face e GitHub, permitindo que investigadores e empresas de todo o mundo possam usá-lo e contribuir para o seu desenvolvimento. Esta aposta na abertura faz parte da estratégia da empresa de Hangzhou de criar modelos de IA mais eficientes e acessíveis, seguindo os passos dos seus modelos anteriores focados em raciocínio (V3) e aprendizagem por reforço (R1).

O “elefante na sala”: a censura chinesa

A DeepSeek junta-se a outras gigantes chinesas como a Baidu, Tencent e Alibaba na vanguarda do desenvolvimento de IA de código aberto. No entanto, como salienta o artigo original do South China Morning Post, existe uma sombra que paira sobre estas inovações: as rigorosas regras de controlo de conteúdo impostas pelo governo chinês.

Especialistas alertam que estas regras, que obrigam os modelos de IA a censurar tópicos considerados sensíveis, podem limitar a adoção e a expansão internacional destes sistemas, mesmo que a sua tecnologia seja de ponta.

Ainda assim, o DeepSeek-OCR representa um avanço técnico notável. É uma demonstração de como a combinação de diferentes modalidades (visão e linguagem) pode levar a soluções de IA mais eficientes e poderosas, capazes de desbloquear o conhecimento escondido em milhões de documentos que, até agora, eram demasiado grandes para serem lidos pelas máquinas.

Outros artigos interessantes:

  • Android vs iOS: a batalha que divide o mundo (e o teu bolso)
  • Confirmado: OnePlus Ace 6 terá bateria de 7.800mAh e ecrã de 165Hz
  • Perdeste o Gmail? A Google tem 2 novas formas de te salvar
PartilhaTweetEnvia
Vitor Urbano

Vitor Urbano

Frequentou a licenciatura de Desporto em Setúbal e atualmente reside na Letónia. Apaixonado por novas tecnologias e fã do "pequeno" Android desde 2009.

Artigos relacionados

Chatgpt adobe photoshop
Inteligência Artificial

ChatGPT ganha poderes de Photoshop: agora podes editar fotos sem sair do chat

12/12/2025
Google lança agente "gemini deep research"
Inteligência Artificial

Google lança agente “Gemini Deep Research”

12/12/2025
Google maps - google gemini (2)
Google

Google Maps no Gemini: agora vês mais do que apenas alfinetes vermelhos

12/12/2025
Openai disney
Inteligência Artificial

Disney investe 1 bilião na OpenAI: cria vídeos do Mickey com IA

12/12/2025
Google home - google gemini
Google

Google acelera o Gemini for Home: a IA chega a mais casas (e mais rápido)

11/12/2025
Genai. Mil: o plano de 800 milhões para modernizar a defesa dos eua
Inteligência Artificial

GenAI.mil: o plano de 800 milhões para modernizar a defesa dos EUA

10/12/2025

Últimas notícias

Google atualiza pixel watch 4 com novos gestos e ia

Google atualiza Pixel Watch 4 com novos gestos e IA

13/12/2025
Realme c75

Realme C75 5G: a bateria que não acaba e o design indestrutível por 151€

12/12/2025
Dji neo 2 apple watch

DJI Neo 2: controla o drone e vê vídeo em direto no teu Apple Watch

12/12/2025
QNAP

Mac mini M4: a potência da Apple num cubo compacto está com desconto raro

ChatGPT ganha poderes de Photoshop: agora podes editar fotos sem sair do chat

Google lança agente “Gemini Deep Research”

Google Maps no Gemini: agora vês mais do que apenas alfinetes vermelhos

Análise Bose QC Ultra 2: ANC, som e conforto de topo

iPhone 16e em promoção: o modelo mais equilibrado da Apple tem desconto de 120€

Huawei apresenta FreeClip 2 e Mate X7 em evento global no Dubai

Qualcomm lança novos ‘motores’ para telemóveis baratos: o que muda em 2026?

Disney investe 1 bilião na OpenAI: cria vídeos do Mickey com IA

Google em risco de multa pesada: UE exige que a Play Store siga o exemplo da Apple

Instagram entrega as chaves do algoritmo: agora tu decides o que vês nos Reels

Eleições presidenciais: TikTok aperta o cerco às “fake news”

Spotify lança ‘Prompted Playlist’: agora és tu quem manda no algoritmo

Cosori Turbo Tower Pro: a fritadeira dupla que poupa espaço está em promoção

Google lança Vídeo de Emergência em Direto para ajudar o 112 no Android

Roomba Plus 505 Combo: o robô que lava, seca e esvazia sozinho com 350€ de desconto

DJI Avata 360: o drone que vê tudo está pronto para estragar a festa da Insta360

Techenet LOGO
  • Quem somos
  • Fale connosco, envie a sua pergunta aqui
  • Termos e condições
  • Política de comentários
  • Política de Privacidade
  • Política de Cookies
Sem resultados
Ver todos os resultados
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS

© 2025 JNews - Premium WordPress news & magazine theme by Jegtheme.