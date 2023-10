The New York Times

O ChatGPT, chatbot amplamente usado, foi projetado para gerar texto digital, de poesia até trabalhos acadêmicos e programas de computador. Mas, quando pesquisadores de IA (inteligência artificial) da empresa de chips Nvidia tiveram acesso à tecnologia por trás do chatbot, eles perceberam que poderia fazer muito mais.

Em poucas semanas, eles a ensinaram a jogar Minecraft, um dos videogames mais populares do mundo. Dentro do universo digital do jogo, a tecnologia aprendeu a nadar, coletar plantas, caçar porcos, minerar ouro e construir casas.

"Ela pode entrar no mundo do Minecraft, explorar por conta própria, coletar materiais por conta própria e melhorar cada vez mais em todas as habilidades", disse Linxi Fan, conhecido como Jim, pesquisador sênior da Nvidia.

Agentes de IA realizam tarefas por conta própria dentro do "Minecraft" - Nvidia via The New York Times

O projeto foi um sinal precoce de que os principais pesquisadores da área estão transformando os chatbots em um novo tipo de sistema autônomo chamado agente de IA. Esses agentes podem fazer mais do que apenas conversar. Eles podem usar aplicativo, sites e outras ferramentas online, incluindo planilhas, calendários, sites de viagens e muito mais.

Com o tempo, muitos pesquisadores dizem que os agentes de IA podem se tornar muito mais sofisticados e substituir os trabalhadores de escritório, automatizando quase qualquer trabalho do tipo.

"Esta é uma enorme oportunidade comercial, potencialmente de trilhões de dólares", disse Jeff Clune, professor de ciência da computação da Universidade da Colúmbia Britânica (Canadá), que já havia trabalhado com a tecnologia como pesquisador da OpenAI, startup que criou o ChatGPT. "Isso tem um enorme potencial de crescimento e enormes consequências para a sociedade."

O agente da Nvidia joga um videogame. Agentes semelhantes podem agendar reuniões, editar arquivos, analisar dados e construir gráficos de barras coloridas. A ideia é que esses sistemas automatizados eventualmente atuem como assistentes pessoais capazes de lidar com uma ampla gama de tarefas pela internet.

Os agentes de hoje são limitados e não conseguem exatamente organizar sua vida. O ChatGPT pode pesquisar no site de viagens Expedia por voos para Nova York, mas você ainda precisa fazer a reserva por conta própria.

Essa tecnologia, à medida que os pesquisadores a aprimoram, pode tornar os trabalhadores de escritório e os consumidores mais eficientes. Também pode mudar a natureza dos videogames, fornecendo uma nova onda de bots (robôs) com os quais os gamers podem jogar e conversar.

O GPT-4, a tecnologia que sustenta o ChatGPT, é o que os pesquisadores chamam de grande modelo de linguagem (LLM, na sigla em inglês). É um sistema de IA que aprende habilidades analisando enormes quantidades de dados.

Nos últimos meses, a tecnologia impressionou centenas de milhões de pessoas com a maneira como gera emails, escreve discursos e improvisa sobre quase qualquer assunto. Mas sua habilidade mais importante pode ser sua capacidade de desenvolver programas de computador.

A tecnologia pode gerar instantaneamente um programa que desenha um unicórnio ou faz neve digital cair na tela do seu notebook. Desenvolvedores de software profissionais podem solicitar códigos que conseguem incorporar em programas maiores, incluindo desde aplicativos de redes sociais até motores de busca.

Mas isso é apenas parte do que essa tecnologia pode fazer. Ela também pode gerar códigos de programação que se conectam a outros aplicativos e sites.

Foi assim que Fan e outros pesquisadores da Nvidia ensinaram o GPT-4 a jogar Minecraft. "A palavra mais importante aqui é código", disse Fan. "O código pode tomar ações."

As pessoas usam aplicativos e sites pressionando botões, menus e outros elementos gráficos. Já os agentes de IA usam aplicativos e sites acessando suas interfaces de programação (APIs, na sigla em inglês), o código de software subjacente que permite que eles se comuniquem com outros serviços online.

Se você pedir a um agente para subir um vídeo na internet, por exemplo, ele pode gerar um código que chame uma API oferecida pelo YouTube. "Uma API é apenas o texto usado para se comunicar com uma máquina", disse Silen Naihin, pesquisador que ajuda a administrar um projeto independente de agente de IA, o AutoGPT.

Peças de xadrez do pesquisador Jeff Clune foram criadas por IA e impressas em impressora 3D - Alana Paterson - 19.set.2023/The New York Times

Em teoria, um chatbot pode escrever código para acessar qualquer API na internet. Mas os chatbots de hoje ainda não são habilidosos o suficiente para fazer mais do que tarefas simples. E mesmo que fossem, permitir que eles percorram livremente a internet seria um enorme risco de segurança. Portanto, as empresas estão começando devagar.

Alguns meses após a OpenAI lançar o ChatGPT, a empresa lançou discretamente uma maneira para o chatbot fazer mais do que gerar texto. Após instalar vários plugins —extensões que aumentam o que o chatbot pode fazer—, você poderia pedir a ele para pesquisar em sites de viagens, como o Expedia, por voos disponíveis, pegar um mapa da sua cidade natal no Google Earth ou até mesmo transformar uma planilha detalhando seus gastos anuais em um gráfico de barras.

Equipado com um plugin chamado "code interpreter" [interpretador de código], o ChatGPT não apenas poderia escrever o programa, mas também executá-lo. Isso permitiu que a tecnologia realizasse instantaneamente tarefas que antes não conseguia, incluindo a edição de planilhas e a transformação de imagens estáticas em vídeos. Google, Microsoft e outras empresas estão explorando tecnologias semelhantes.

"Esses são projetos nos quais estamos imaginando essencialmente IAs trabalhando com outras IAs para você", disse Ashley Llorens, diretor da Microsoft Research.

Projetos independentes, como o AutoGPT, estão tentando levar esse tipo de ideia ainda mais longe. A proposta é dar ao sistema metas como "criar uma empresa" ou "ganhar dinheiro". Em seguida, ele procurará maneiras de alcançar esse objetivo fazendo perguntas a si mesmo e se conectando a outros serviços da internet.

Hoje, isso não funciona tão bem. Sistemas como o AutoGPT tendem a ficar presos em loops intermináveis. Mas pesquisadores como Linxi Fan, da Nvidia, estão constantemente aprimorando esse tipo de tecnologia na tentativa de torná-la mais útil e confiável.

Outros pesquisadores estão construindo um novo tipo de agente de IA projetado para usar ferramentas de software. No verão de 2022, Jeff Clune estava entre uma equipe de pesquisadores da OpenAI que construiu um agente que poderia usar software de computador da mesma forma que uma pessoa —clique a clique do mouse, tecla a tecla.

Clune e seus colegas alimentaram o sistema com horas de vídeos online que mostravam pessoas jogando Minecraft. Ao analisar a maneira como as pessoas usavam o mouse e o teclado para navegar pelo universo digital do Minecraft, o sistema aprendeu a jogar o jogo por conta própria.

Outras empresas, incluindo uma startup chamada Adept, estão construindo agentes semelhantes que usam sites como Wikipedia, Redfin e Craigslist e aplicativos voltados ao trabalho, de empresas como Salesforce.

Clune argumenta que esse tipo de agente eventualmente permitirá que a inteligência artificial use uma gama muito mais ampla de aplicativos de software e sites. Ele disse que todos teriam acesso a um assistente digital que poderia potencialmente fazer quase qualquer coisa na internet. Isso poderia facilitar a vida —mas também poderia substituir inúmeros empregos.

"Se a IA pode fazer tudo o que podemos fazer, ela não substitui apenas as tarefas chatas", disse. "Ela substitui todas as tarefas."