A OpenAI, a empresa responsável pelo ChatGPT, anunciou recentemente o lançamento do Operator, um agente de IA capaz de realizar tarefas autonomamente na web.
O Operator foi apresentado como uma pesquisa experimental focada em processos automáticos, dispensando integrações de interface de programação de aplicações (API). O anúncio contempla objetivos relacionados com a expansão da utilidade da IA em tarefas do dia a dia.
A empresa responsável pelo ChatGPT descreveu Operator como um dos primeiros agentes capazes de interagir com interfaces gráficas, utilizando cliques, introdução de texto e outras ações comuns num navegador. Esta abordagem tem como propósito otimizar fluxos de trabalho, além de fornecer novas formas de interação entre utilizadores e serviços online.
Operator: Um agente de IA para tarefas diárias
Inicialmente disponível para utilizadores dos Estados Unidos com a subscrição ChatGPT Pro, o Operator deve ser expandido, segundo a GlobalData, a mais utilizadores nos planos Plus, Team e Enterprise.
A OpenAI destaca que a capacidade do Operator de utilizar as mesmas interfaces e ferramentas que os humanos interagem diariamente amplia a utilidade da IA, ajudando as pessoas a poupar tempo em tarefas cotidianas e abrindo novas oportunidades de engajamento para as empresas.
Inteligência artificial com visão e raciocínio
O Operator é alimentado pelo modelo CUA (Computer-Using Agent), que integra as capacidades visuais do GPT-4 com “raciocínio avançado” através de aprendizagem por reforço. Isto permite ao CUA interagir com interfaces gráficas de utilizador (GUIs), como botões, menus e campos de texto num ecrã.
O agente de IA pode “ver” (através de capturas de ecrã) e “interagir” (utilizando todas as ações que um rato e teclado permitem) com um navegador, permitindo-lhe tomar ações na web sem necessitar de integrações de API personalizadas.
Se o Operator encontrar desafios ou cometer erros, pode “autocorrigir-se” utilizando as suas capacidades de raciocínio. Em situações em que necessita de assistência, o Operator devolve o controlo ao utilizador.
A corrida pela IA avança
O lançamento do Operator ocorre num momento em que a corrida pela inteligência artificial está a acelerar. A OpenAI, em parceria com a SoftBank, anunciou recentemente um projeto de IA de 500 mil milhões de dólares, chamado Stargate. Este projeto visa construir “uma nova infraestrutura de IA para a OpenAI” nos Estados Unidos.
Vale a pena lembrar que a Perplexity, concorrente da OpenAI, lançou um assistente baseado em agente para dispositivos Android. Este assistente utiliza raciocínio, pesquisa e aplicações para ajudar com tarefas diárias, desde perguntas simples até ações multi-aplicação.
O lançamento do Operator e outros desenvolvimentos recentes demonstram o rápido progresso da IA e o seu potencial para revolucionar a forma como interagimos com a tecnologia.
Outros artigos interessantes:
- Android 16 Beta já começou a chegar a alguns Google Pixel: o que esperar?
- Google faz investimento milionário em XR e compra parte da HTC
- Apple revela pela primeira vez números de adoção do iOS 18 e iPadOS 18