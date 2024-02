Na semana passada, o mundo assistiu perplexo aos vídeos criados pela plataforma Sora, projeto mais recente da empresa de inteligência artificial OpenAI. As imagens mostram uma mulher caminhando em Tóquio, cães brincando na neve e uma casa em um rochedo em frente ao mar. Todas foram sintetizadas por IA a partir de um mero parágrafo de texto com instruções. Todas são convincentes como se fossem a própria realidade (ao menos para quem olha de forma desatenta).

Vídeos são para nós humanos a prova mais confiável de que algo aconteceu. Nos últimos anos aprendemos que textos e imagens são facilmente manipuláveis. Mas e o vídeo? Para a maioria das pessoas isso é o que mostra que algo de fato ocorreu. Tudo isso agora cai por terra. Não dá mais para confiar em nenhum vídeo.

Imagine alguém usando a IA com a seguinte instrução: "Crie um vídeo para burlar o reconhecimento facial de um banco. Vire a cabeça para a direita e esquerda, olhe para cima, da forma como o banco solicita para autenticação". Vários bancos, inclusive no Brasil, usam reconhecimento facial como mecanismo de segurança. Com as ferramentas de inteligência artificial poderá ser fácil enganar todos. Ter certeza de quem está do outro lado da tela vai se tornar mais caro e difícil.

O problema está longe de ser só esse. Com o lançamento do Sora a OpenAI quer dar um recado: a empresa é o futuro da criação audiovisual.

Hoje a indústria de games, filmes e séries detêm o monopólio da criação das imagens mais atraentes e valiosas do planeta. Isso é feito com produções caras e difíceis de realizar, filmadas as partir da realidade ou arduamente programadas. A OpenAI quer mostrar que no futuro (talvez próximo) será capaz de fazer o mesmo com imagens sintéticas, geradas por IA.

Mais do que isso, vai entregar esse fogo prometeico para qualquer pessoa, que poderá conjurar a IA para criar de obras monumentais inéditas a pornografia, fake news e interferências em campanhas eleitorais.

O curioso é que a empresa não revela mais como o Sora (que significa "céu" em japonês) foi treinado, como receio das questões de direito autoral. Isso teria sido feito com todo tipo de vídeo da internet, filmes, séries e dados sintéticos gerados por videogames. Quando estive com Sam Altman no Brasil no semestre passado, ele enfatizou a importância de dados sintéticos para o treinamento das IAs atuais.

O Sora é o mais novo "slide" que Altman mostra para o mundo dentro do seu plano de captar US$ 7 trilhões (R$ 34,79 trilhões). Se der certo, será o maior levantamento de capital da história. O objetivo seria chegar à "inteligência artificial geral", dominando o mercado de chips.

A tese é de que, com a chegada da inteligência artificial, muitos setores econômicos se tornam "legados", relíquias do passado. Isso inclui de Hollywood à Netflix, o mercado financeiro, boa parte das áreas de saúde, engenharia, medicina, direito, contabilidade e gestão, sem falar no setor militar e de equipamentos bélicos. O que tornaria os US$ 7 trilhões baratos perto do prêmio buscado

Há também a tese de que isso tudo é truque, e estamos sendo coletivamente ludibriados, dentre outras coisas, por vídeos de mulheres andando em Tóquio e cachorros brincando na neve.

