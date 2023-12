Uma verdade incômoda ronda o imaginário daqueles que acham que o GPT-10 ou subsequente irá subjugar a espécie humana: sempre é possível que alguém tire o servidor da tomada antes que o último entre nós sucumba. Outra, não menos importante, é que há coisas sobre o mundo que só podem ser apreendidas in situ. A ideia de que a natureza da realidade se revela na íntegra por meio de registros digitalizáveis está errada.

Após anos de armazenamento, os vinhos "de guarda" adquirem buquês específicos, tidos como primorosos. Porém, é comum que estraguem na garrafa, tornando-se piores que os de rolha de plástico. Um enólogo de histórico suspeito, servindo um grande vinho de 1980 para um conviva, pode estar sinalizando deferência, como também pode estar fazendo o oposto. Tudo depende da história que contam as moléculas voláteis que se espalham pelo ar.

Robôs em planta da Amazon no estado de Washington, EUA - Jason Redmond - 18.out.23/AFP

Não importa que Proust tenha sido capaz de descrever aromas de maneira sublime, que as equações moleculares sejam conhecidas e que ambas as coisas possam ser atualizadas pelos algoritmos generativos do futuro próximo: só o contato com o real resolve essa questão.

Vivemos um estágio da transição rumo à metamodernidade que um dia será descrito como o da fascinação digital. Sua marca é a cegueira seletiva para o fato de que há um sem-fim de fenômenos irredutíveis aos seus correlatos binários, sejam estes textos, vídeos ou o que for.

No artigo anterior da coluna, mencionei que figuras proeminentes como Dario Amodei (Anthropic) e Shane Legg (Deep Mind) acreditam que a inteligência artificial geral pode ser atingida até o final desta década e afirmei que eu acho isso improvável.

A razão é, justamente, que parte relevante das nossas capacidades cognitivas ganha contornos no mundo. Não faz sentido considerar que a IA pode ser "geral", enquanto se mantém, selada em uma caixa, incapaz de apreender o clima implícito em certas interações, incorporar aromas aos seus modelos de realidade (para entender, acesse), entre tantos outros fenômenos irredutíveis aos seus registros.

A lacuna gigante que subiste com relação ao mundo real dá uma dimensão da disrupção que os robôs multifuncionais tendem a representar. Por mais que cheguem ao mercado cheios de limitações e defeitos, essas traquitanas inteligentes devem quebrar mais paradigmas que a IA generativa e produzir efeitos socioeconômicos muito mais profundos, com a diferença de que não basta tirar o servidor da tomada para estancar o curso do seu desenvolvimento.

Este é o ângulo pelo qual considero a notícia de que a primeira fábrica dedicada à produção em massa de robôs antropomórficos acaba de ser inaugurada em Salem (Oregon, EUA; para conhecer, acesse). É sabido que o seu humanoide de lata precisa evoluir bastante, mas o fato de a fábrica da Agility Robotics ter capacidade instalada de 10 mil unidades por ano, ao mesmo tempo que centenas de outras plantas industriais estão sendo construídas ou ampliadas com o mesmo propósito, sugere que os robôs estão se aproximando rapidamente do seu momento ChatGPT.

De certo modo, isso representa um passo "natural". A Amazon, líder na fabricação e uso de robôs industriais, utiliza mais de 750 mil dessas máquinas. Atualmente, 75% das encomendas de clientes são processadas com a ajuda de robôs, sendo que um único tipo, chamado Robin, já manejou mais de 2 bilhões de pacotes. O fenômeno é generalizável para a indústria como um todo, onde empregos desaparecem com velocidade maior do que ressurgem para a gestão dessas máquinas e treinamento das equipes.

É a tal Quarta Revolução Industrial, noção que nunca me convenceu, dado que (1) a economia global é predominantemente centrada em serviços e (2) há sérias limitações àquilo que máquinas fixas podem fazer fora da linha de produção de "Tempos Modernos". As principais tentativas de robotizar restaurantes, recepções, hospitalidade para pacientes ou mesmo fábricas em que a produção demanda maior flexibilidade operacional deram errado.

Porém, isso deve mudar, o que não significa que este século será palco para mais uma revolução ‘industrial’, mas que a indústria irá se tornar parte de outro tipo de processo de destruição criativa.

Como todo anjo sabe, o corpo humano não possui o design mais elaborado imaginável. Mas, no mundo das formas naturais, é considerado um portento, além de ser ideal para a geração de empatia em outros humanos. Isto explica por que servimos de molde principal para os robôs multifuncionais, desde antes da criação do Elektro, de 1938, que era capaz de falar 700 palavras, encher balões, mexer os braços e até fumar, o que nem eu nem você veremos robô algum fazer.

O Elektro está para os robôs que irão quebrar paradigmas nos próximos anos como o carrinho de controle remoto está para os veículos autônomos. A diferença está menos naquilo que pode fazer que na necessidade de planejamento humano para que o faça.

Precisamente por isso, não me impressiono tanto com as piruetas e o parkour do Atlas, o robô-estrela da Boston Dynamics. O show é incrível, mas o que ninguém conta é que cada um daqueles movimentos foi programado. A cada novo truque que o Atlas adquire, os outros robôs da companhia —e o mundo da inteligência de máquina como um todo— avançam zero metros.

Abordagem muito diferente é a da Tesla, cujo humanoide orienta-se por aprendizado por reforçamento (IA). Cada novo truque seu converte-se em passinhos na direção da autonomia plena dos carros da empresa, na execução do plano de lançar uma frota de taxis autônomos, bem como no desenvolvimento de uma nova ‘inteligência artificial corporificada’.

Vale conhecer o Optimus 2, modelo recém-lançado do robô. Destreza de cair o queixo. Segundo divulgado na conferência de investidores deste ano, a expectativa é que a divisão de robôs da companhia se torne muito maior que a de carros. "Acredito que excederemos a relação 1:1 entre robôs humanoides e humanos". Parece mais um caô do Musk, mas é bom ter em mente que se trata da posição dominante nesta área.

Parte do entusiasmo vem da capacidade dos cientistas de incorporar IA generativa aos programas de aprendizado por reforçamento que atualmente guiam os robôs de comportamento flexível.

O ponto não é que isso permite ao robô declamar poemas sobre bacalhaus à moda de Camões, mas que habilita o uso da base informacional desses algoritmos na "etiquetagem" da realidade durante as suas varreduras espaciais, como exemplificado pelo Digit, que se mostra capaz de "pegar a caixa com a cor do sabre do Darth Vader e colocar sobre a torre mais alta da primeira fila".

É um salto e tanto. Porém, a linha de aprendizado mais impactante nem sequer foi implementada. No artigo "Aprendendo a imitar com poucos exemplos através de transmissão cultural" (Nature, 2023), pesquisadores do Google mostram como robôs podem aprender a se comportar e a produzir sínteses conclusivas usando os métodos que os antropólogos descrevem como típicos da transmissão cultural.

Na prática, basta assistirem às pessoas agindo para conseguirem emular seus comportamentos e mesmo tirar conclusões sobre a sua função e adequabilidade. Também é possível alimentá-los com milhões de horas de vídeos para se complementar as lições.

A incorporação dessa habilidade é justamente o que deverá gerar o tal momento ChatGPT dos robôs, redefinindo os rumos da IA, da economia e das relações sociais, além de tornar eminente o desenvolvimento do campo da psicologia de máquinas, que foi descrito em primeira mão aqui.