TecheNet
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS
Sem resultados
Ver todos os resultados
TecheNet
Sem resultados
Ver todos os resultados

DeepSeek lança IA que “vê” documentos para poupar recursos

Vitor Urbano por Vitor Urbano
21/10/2025
Em Inteligência Artificial

A inteligência artificial está a devorar quantidades massivas de dados, mas processar documentos gigantescos – relatórios financeiros de centenas de páginas, artigos científicos complexos, livros inteiros – continua a ser uma tarefa computacionalmente cara e lenta. A startup chinesa DeepSeek acredita ter encontrado uma solução engenhosa para este problema: acaba de lançar o DeepSeek-OCR, um novo modelo de IA que não se limita a ler texto; ele vê a página como um todo, usando essa perceção visual para comprimir a informação de forma radical.

Disponível em código aberto, esta nova abordagem multimodal promete reduzir drasticamente os recursos necessários para que as IAs compreendam documentos extensos, abrindo novas portas para a análise de informação em larga escala.

O problema dos “tokens”: porque é que os documentos grandes são tão caros para a IA?

Para entender a importância do DeepSeek-OCR, é preciso perceber como os grandes modelos de linguagem (LLMs) processam a informação. Eles não leem palavras como nós; eles dividem o texto em pequenas unidades chamadas “tokens”. Um documento longo pode facilmente conter milhões de tokens.

Processar todos estes tokens exige uma enorme quantidade de poder computacional e memória, o que se traduz em custos elevados e tempos de processamento longos. É por isso que muitos chatbots têm limites no tamanho dos documentos que conseguem analisar.

Deepseek ia

A solução da DeepSeek: usar os olhos em vez de apenas ler

A inovação do DeepSeek-OCR reside na sua abordagem multimodal. Em vez de simplesmente converter toda a página num mar de tokens de texto, o sistema usa a perceção visual como uma forma de compressão.

Funciona em duas fases:

  1. O Codificador Visual (DeepEncoder): Primeiro, a IA “olha” para a página inteira, identificando não só o texto, mas também a sua estrutura visual – onde estão os títulos, as tabelas, os gráficos, as fórmulas matemáticas, os diagramas.
  2. O Descodificador Inteligente (MoE): Com base nesta compreensão visual, o sistema consegue representar a informação de forma muito mais compacta. Em vez de enviar milhões de tokens de texto para o modelo de linguagem, ele envia um número muito menor de tokens que representam a estrutura visual e o conteúdo essencial.

Segundo a DeepSeek, este método permite reduzir o volume de texto (tokens) entre sete e vinte vezes. É uma compressão massiva que torna possível processar documentos enormes sem um aumento proibitivo nos custos ou no tempo.

Mais do que texto: compreender tabelas, fórmulas e diagramas

A grande vantagem de usar a visão não é apenas a compressão. O DeepSeek-OCR consegue interpretar o significado de elementos não textuais, como tabelas complexas, fórmulas matemáticas ou diagramas de fluxo.

Isto abre um leque de aplicações em áreas onde a informação visual é crucial:

  • Finanças: Análise automática de relatórios financeiros complexos, com tabelas e gráficos.
  • Investigação Científica: Extração de dados de artigos científicos, incluindo fórmulas e resultados experimentais.
  • Análise Documental: Processamento de documentos legais, contratos ou manuais técnicos que misturam texto com diagramas.

Desempenho impressionante e a aposta no código aberto

Nos testes divulgados pela empresa, o DeepSeek-OCR demonstrou a sua eficácia. Mesmo com taxas de compressão elevadas (inferiores a 10x), o modelo manteve uma precisão de reconhecimento de caracteres de 97%, superando outros modelos de OCR concorrentes.

Fiel à sua filosofia, a DeepSeek disponibilizou o modelo em código aberto nas plataformas Hugging Face e GitHub, permitindo que investigadores e empresas de todo o mundo possam usá-lo e contribuir para o seu desenvolvimento. Esta aposta na abertura faz parte da estratégia da empresa de Hangzhou de criar modelos de IA mais eficientes e acessíveis, seguindo os passos dos seus modelos anteriores focados em raciocínio (V3) e aprendizagem por reforço (R1).

O “elefante na sala”: a censura chinesa

A DeepSeek junta-se a outras gigantes chinesas como a Baidu, Tencent e Alibaba na vanguarda do desenvolvimento de IA de código aberto. No entanto, como salienta o artigo original do South China Morning Post, existe uma sombra que paira sobre estas inovações: as rigorosas regras de controlo de conteúdo impostas pelo governo chinês.

Especialistas alertam que estas regras, que obrigam os modelos de IA a censurar tópicos considerados sensíveis, podem limitar a adoção e a expansão internacional destes sistemas, mesmo que a sua tecnologia seja de ponta.

Ainda assim, o DeepSeek-OCR representa um avanço técnico notável. É uma demonstração de como a combinação de diferentes modalidades (visão e linguagem) pode levar a soluções de IA mais eficientes e poderosas, capazes de desbloquear o conhecimento escondido em milhões de documentos que, até agora, eram demasiado grandes para serem lidos pelas máquinas.

Outros artigos interessantes:

  • Android vs iOS: a batalha que divide o mundo (e o teu bolso)
  • Confirmado: OnePlus Ace 6 terá bateria de 7.800mAh e ecrã de 165Hz
  • Perdeste o Gmail? A Google tem 2 novas formas de te salvar
PartilhaTweetEnvia
Vitor Urbano

Vitor Urbano

Frequentou a licenciatura de Desporto em Setúbal e atualmente reside na Letónia. Apaixonado por novas tecnologias e fã do "pequeno" Android desde 2009.

Artigos relacionados

Ia generativa decifra malware xloader em horas, não dias
Segurança

IA generativa decifra malware XLoader em horas, não dias

09/11/2025
Inovação no retalho: agentes de ia prontos para empresas
Opinião

Nova era para a inovação no retalho: agentes de IA prontos para empresas

05/11/2025
Industrial ai cloud
Inteligência Artificial

Soberania digital europeia: gigantes unem-se para criar IA industrial de 1 bilião

05/11/2025
Openai ghibli
Inteligência Artificial

Studio Ghibli e Square Enix dizem “basta” à OpenAI: a batalha pelos direitos de autor

04/11/2025
Google gemini siri
Apple

A união dos rivais: a Siri será alimentada pela IA Gemini da Google em 2026

03/11/2025
Getty images e perplexity ai firmam acordo de licenciamento para ia
Inteligência Artificial

Getty Images e Perplexity AI firmam acordo de licenciamento para IA

01/11/2025

Últimas notícias

Campanha de phishing usa domínio legítimo do facebook

Campanha de phishing usa domínio legítimo do Facebook

11/11/2025
Samsung the frame

Samsung The Frame: 1.000 euros de desconto nesta TV que parece um quadro

11/11/2025
A consultoria de ti: não é um custo, é um investimento

A consultoria de TI: não é um custo, é um investimento

11/11/2025
QNAP

Samsung Galaxy S25 FE atinge mínimo histórico: topo de gama com 7 anos de suporte

Pechincha do 11/11: Trotinete elétrica de 750 W e suspensão dupla por apenas 274€

Troca-rápida de bateria: o novo elétrico chinês de 5.000€ que desafia os postos de carregamento

Honor X80: a bateria de 10.000mAh e o ecrã gigante a caminho

NOVA IMS no topo mundial de Process Mining (Celonis)

NIU ataca mercado com motas elétricas legais para a rua e scooters com Google Maps

Marca portuguesa Volt Padel entra no Harrods

Realme GT 8 Pro: a edição limitada que leva a Fórmula 1 ao teu bolso

HUAWEI Watch D2 recebe análise de arritmias e nova cor

Galaxy S26: Samsung desmente atraso e aponta para lançamento em janeiro

Reuniões falsas no Zoom e Teams: O golpe GhostCall

Poco F8 Pro e Redmi Note 15 Pro 4G a caminho da Europa e Ásia

Apenas 45% das PME usam faturação eletrónica

Nintendo Switch 2: a consola que não vai subir de preço (por enquanto)

PlayStation 6: Sony e AMD revelam Radiance Cores para uma nova era de gráficos

JBL Junior FREE: os primeiros auriculares open-ear para crianças

IA generativa decifra malware XLoader em horas, não dias

Techenet LOGO
  • Quem somos
  • Fale connosco, envie a sua pergunta aqui
  • Termos e condições
  • Política de comentários
  • Política de Privacidade
  • Política de Cookies
Sem resultados
Ver todos os resultados
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS

© 2025 JNews - Premium WordPress news & magazine theme by Jegtheme.