Siga a folha

Conheça o Dall-E, inteligência artificial que é fábrica de memes

Tecnologia mistura palavras e imagens, ajuda artistas gráficos, mas pode acelerar desinformação

Assinantes podem enviar 5 artigos por dia com acesso livre

ASSINE ou FAÇA LOGIN

Continue lendo com acesso ilimitado.
Aproveite esta oferta especial:

Oferta Exclusiva

6 meses por R$ 1,90/mês

SOMENTE ESSA SEMANA

ASSINE A FOLHA

Cancele quando quiser

Notícias no momento em que acontecem, newsletters exclusivas e mais de 200 colunas e blogs.
Apoie o jornalismo profissional.

Cade Metz
São Francisco (Califórnia) | The New York Times

No OpenAI, um dos laboratórios de IA (Inteligência Artificial) mais ambiciosos do mundo, pesquisadores desenvolveram uma tecnologia que permite criar imagens digitais simplesmente descrevendo o que você deseja ver.

Eles a chamam de Dall-E em alusão tanto a "Wall-E", o filme de animação de 2008 sobre um robô autônomo, quanto ao pintor surrealista Salvador Dalí.

Alex Nichol, um dos pesquisadores do sistema, demonstrou como ele funciona: quando ele pediu "um bule em forma de abacate", digitando essas palavras, o sistema criou dez imagens diferentes de um bule verde-abacate, alguns com caroços e outros sem.

Inteligência Artificial cria imagens digitais a partir de texto; com Darth Vader jogando tênis na praia - Reprodução/Twitter

A ideia é que a ferramenta forneça a artistas gráficos novos atalhos e novas ideias na produção de imagens digitais.

Para muitos especialistas, entretanto, o Dall-E causa preocupação. À medida que esse tipo de tecnologia melhora, dizem eles, ela pode ajudar a espalhar desinformação na internet, alimentando o tipo de campanha online que pode ter influenciado a eleição presidencial de 2016 nos Estados Unidos.

"Você pode usá-la para coisas boas, mas certamente pode usá-la para todo tipo de aplicações loucas e preocupantes, incluindo 'deepfakes'", como fotos e vídeos enganosos, disse Subbarao Kambhampati, professor de ciência da computação na Universidade Estadual do Arizona.

Já existe desinformação online, mas a preocupação é que isso a leve a novos níveis, diz Oren Etzioni, CEO do Allen Institute for Artificial Intelligence, um laboratório de inteligência artificial em Seattle. "Podemos forjar texto. Podemos colocar texto na voz de alguém. E podemos forjar imagens e vídeos", disse.

Para tentar evitar esse risco, a OpenAI não permite que pessoas de fora usem o Dall-E por conta própria e coloca uma marca d'água no canto de cada imagem que gera.

Mas há outros riscos. Como aprendem suas habilidades a partir de enormes conjuntos de textos, imagens e outros dados online que podem incluir preconceito, os sistemas de IA podem também gerar conteúdo preconceituoso, por exemplo, contra mulheres ou negros. A criação de pornografia, discursos de ódio e campanhas de trollagem também preocupam.

Entenda como funciona Dall-E, baseado em rede neural

Há cerca de cinco anos, os principais laboratórios de IA do mundo construíram sistemas capazes de identificar objetos em imagens digitais e até mesmo gerar imagens por conta própria, como flores, cachorros, carros e rostos.

Alguns anos depois, eles construíram sistemas que fazem o mesmo com linguagem escrita, resumindo artigos, respondendo a perguntas, gerando tuítes e até escrevendo postagens em blogs.

Dall-E é o que pesquisadores de IA chamam de rede neural: um sistema matemático baseado vagamente na rede de neurônios do cérebro. É a tecnologia que reconhece comandos falados em smartphones e identifica a presença de pedestres para carros autônomos.

Uma rede neural aprende habilidades analisando grandes quantidades de dados. Ao identificar padrões em milhares de fotos de abacate, por exemplo, ele aprende a reconhecer um abacate.

O Dall-E procura padrões ao analisar milhões de imagens digitais e legendas que as descrevem. Desta forma, aprende a reconhecer as ligações entre as imagens e as palavras.

Quando alguém descreve uma imagem para Dall-E, ele gera um conjunto de características, como a linha na borda de um trompete ou a curva na orelha de um ursinho de pelúcia.

Em seguida, uma segunda rede neural, chamada de modelo de difusão, cria a imagem. A versão mais recente do Dall-E, revelada em abril, gera imagens de alta resolução que, em muitos casos, parecem fotos.

Embora o Dall-E muitas vezes não consiga entender o que alguém descreveu e às vezes destrua a imagem que produz, a OpenAI continua aprimorando a tecnologia.

Os pesquisadores geralmente podem refinar as habilidades de uma rede neural alimentando-a com quantidades ainda maiores de dados.

Tradução de Luiz Roberto M. Gonçalves

Receba notícias da Folha

Cadastre-se e escolha quais newsletters gostaria de receber

Ativar newsletters

Relacionadas