TecheNet
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS
Sem resultados
Ver todos os resultados
TecheNet
Sem resultados
Ver todos os resultados

Novo estudo refuta a teoria da Apple sobre a inteligência artificial

Vitor Urbano por Vitor Urbano
14/06/2025
Em Apple, Inteligência Artificial

Se acompanhas as notícias de tecnologia, provavelmente ouviste falar de um estudo recente da Apple que causou um grande impacto. A investigação, intitulada “A Ilusão do Pensamento”, chegou a uma conclusão bastante direta: até os mais avançados modelos de inteligência artificial, conhecidos como Modelos de Raciocínio Abrangente (LRMs), acabam por “colapsar” quando confrontados com tarefas verdadeiramente complexas. Esta ideia espalhou-se rapidamente, mas parece que a história não fica por aqui.

Agora, um novo artigo de investigação vem desafiar diretamente as conclusões da Apple, argumentando que o problema pode não estar na capacidade de raciocínio da IA, mas sim na forma como ela foi testada.

Publicado por Alex Lawsen, um investigador da Open Philanthropy, e tendo o próprio modelo de IA Claude Opus da Anthropic como coautor, este novo trabalho sugere que muitos dos resultados mais alarmantes do estudo da Apple se devem a falhas na metodologia experimental e não a uma limitação fundamental da tecnologia.

Apple llm

Uma ilusão da avaliação, não do pensamento

A nova investigação, com o título provocador “A Ilusão da Ilusão do Pensamento”, não nega que os modelos de IA atuais tenham dificuldades com quebra-cabeças de planeamento complexos. O que ela argumenta é que o estudo da Apple confunde as limitações práticas de geração de texto e as configurações de avaliação deficientes com uma falha real de raciocínio. Lawsen aponta três problemas principais na forma como a Apple conduziu os seus testes.

O primeiro grande problema está relacionado com os limites de “tokens”, que são, de forma simplificada, as unidades de texto que um modelo de IA pode gerar de uma só vez. Lawsen aponta que, nos testes onde a Apple afirmava que os modelos “colapsavam”, como no quebra-cabeças da Torre de Hanói com 8 ou mais discos, os modelos estavam simplesmente a atingir o seu limite máximo de texto. As respostas dos próprios modelos confirmam isto, com frases como: “O padrão continua, mas vou parar aqui para poupar tokens”. Ou seja, o modelo não falhou a raciocinar, apenas parou de escrever por causa de uma restrição técnica.

Outro ponto crítico levantado é que o estudo da Apple incluía nos seus testes versões de quebra-cabeças que eram matematicamente impossíveis de resolver dentro das regras dadas. Por exemplo, no teste da Travessia do Rio, foram usadas configurações em que o número de agentes e a capacidade do barco tornavam a tarefa insolúvel. Os modelos de IA foram penalizados por reconhecerem que o problema não tinha solução e por se recusarem a tentar resolvê-lo, o que, ironicamente, demonstra uma forma de raciocínio lógico.

Por fim, a Apple utilizou sistemas automáticos para avaliar as respostas da IA. Estes sistemas julgavam os modelos unicamente pela sua capacidade de fornecer uma lista completa de todos os movimentos necessários para resolver o quebra-cabeças. Esta abordagem rígida classificava injustamente as respostas parciais ou estratégicas como falhas totais, mesmo nos casos em que a solução completa excederia o tal limite de tokens.

Uma forma alternativa de medir o raciocínio

Para provar o seu ponto de vista, Lawsen realizou uma parte dos testes da Torre de Hanói de uma forma diferente. Em vez de pedir aos modelos para listarem exaustivamente todos os movimentos, ele pediu-lhes que gerassem uma função em código (na linguagem Lua) que resolvesse o problema. O resultado foi surpreendente. Modelos como o Claude, o Gemini e o o3 da OpenAI não tiveram qualquer dificuldade em produzir soluções algoritmicamente corretas para problemas com 15 discos, uma complexidade muito para além do ponto onde a Apple tinha reportado um sucesso nulo.

A conclusão de Lawsen é clara: quando se removem as restrições artificiais na forma como a IA pode responder, os modelos parecem perfeitamente capazes de raciocinar sobre tarefas de alta complexidade, pelo menos ao nível da geração de algoritmos. Este debate é mais do que uma picardia académica. A questão fundamental é perceber se as limitações que vemos na IA de hoje são um defeito no seu “motor” de raciocínio ou se somos nós que ainda não aprendemos a fazer as perguntas — e a avaliar as respostas — da forma correta. Antes de declararmos que a capacidade de raciocínio da IA é uma ilusão, talvez valha a pena verificar se os nossos métodos de medição não são a verdadeira ilusão.

Outros artigos interessantes:

  • Google Pixel 10: o sistema magnético que te vai desiludir
  • A jogada de 13,3 mil milhões da Meta para vencer na corrida da IA
  • QNAP lança o Edge AI Storage Server para IA local
PartilhaTweetEnvia
Vitor Urbano

Vitor Urbano

Frequentou a licenciatura de Desporto em Setúbal e atualmente reside na Letónia. Apaixonado por novas tecnologias e fã do "pequeno" Android desde 2009.

Artigos relacionados

Google discover
Inteligência Artificial

Google Discover testa resumos automáticos de notícias com IA

15/07/2025
Tim cook apple
Apple

Apple: pressão sobre Tim Cook cresce em Wall Street

15/07/2025
Apple iphone 17 dummies
Apple

Apple prepara lançamento da família iPhone 17 para a semana de 8 de setembro

15/07/2025
Meta - inteligência artificial
Inteligência Artificial

Meta aposta em tendas para acelerar construção de centros de dados de IA

15/07/2025
Claude ai integrações
Inteligência Artificial

Claude integra-se com as tuas apps e promete simplificar tarefas no dia a dia

15/07/2025
Apple união europeia
Apple

Comissão Europeia recua e Apple respira de alívio

15/07/2025

Promoções interessantes

Samsung galaxy a26
Promoções

Este Samsung tem um desconto de 110€ e suporte para 6 anos

06/07/2025
Apple macbook air m4 (4)
Promoções

Promoção: MacBook de 1000 euros é a escolha ideal para estudantes

04/07/2025
Sharp ht-sb110 sound bar
Promoções

Som de cinema por 50 euros: a barra de som que a tua TV precisa

04/07/2025
QNAP

Mobilidade Elétrica

Spark alliance: 1. 700 postos de carregamento unidos

Spark Alliance: 1.700 postos de carregamento unidos

por Alfredo Beleza
16/07/2025

A Spark Alliance, uma nova parceria entre quatro dos principais operadores europeus, já está ativa e acessível aos condutores de...

Bicicleta elétrica texas

Bicicleta elétrica transforma voluntário em herói das cheias no Texas

por Vitor Urbano
15/07/2025

Quando as cheias devastadoras atingiram recentemente a região de Sandy Creek, no Texas, uma pequena comunidade viu-se isolada do mundo...

Honda moto elétrica

Nova mota elétrica da Honda promete mobilidade acessível para todos

por Vitor Urbano
14/07/2025

A Honda está a preparar-se para dar um passo importante no segmento das motas elétricas, como revelam recentes imagens de...

Volkswagen id. Every1 (4)

Carros elétricos já são 73% mais limpos do que modelos a gasolina

por Vitor Urbano
10/07/2025

A mobilidade elétrica na Europa está a dar passos largos na luta contra as alterações climáticas. Um novo relatório do...

Guias Techenet

Transforma o teu tablet: os melhores teclados bluetooth em 2025

Portáteis até 200 euros: Guia para encontrares o ideal em 2025

A revolução dos ecrãs AMOLED em smartphones baratos: vê os melhores!

Explorando as melhores ferramentas tecnológicas para aprender inglês online

Cartório: Conheça Seus Diferentes Tipos, Funções e Serviços

Registar a sua Marca em Portugal

Como realizar a recuperação de dados de um conjunto RAID Synology quebrado?

Techenet LOGO
  • Quem somos
  • Fale connosco, envie a sua pergunta aqui
  • Termos e condições
  • Política de comentários
  • Política de Privacidade
  • Política de Cookies
Sem resultados
Ver todos os resultados
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS

© 2025 JNews - Premium WordPress news & magazine theme by Jegtheme.