Novo em Folha

Programa de Treinamento

Novo em Folha - Editoria de treinamento
Editoria de treinamento
Descrição de chapéu Facebook Meta

Nova tecnologia da Meta transforma pequenos textos em vídeos curtos

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

São Paulo

A Meta, antigo Facebook, lançou na quinta-feira (29) um sistema de inteligência artificial que gera vídeos curtos a partir de pequenos textos.

A ferramenta, chamada Make-A-Video, funciona assim: o usuário digita uma pequena frase, como "cachorro usando roupa de super herói e capa vermelha voando pelos céus" e cria um vídeo de cinco segundos a partir disso.

A nova ferramenta, Make-A-Video, possibilita a criação de vídeos curtos a partir de frases como “cachorro usando roupa de super herói e capa vermelha voando pelos céus” - AFP

No site oficial da ferramenta (makeavideo.studio), é possível assistir a pequenos vídeos gerados a partir de frases como "peixe-palhaço nadando por um coral de arrecife", "cavalo bebendo água" e "casal jovem andando na chuva forte".

A ferramenta nos oferece um spoiler do que deve estar vindo por aí quando se trata de generative artificial intelligence (inteligência artificial geradora, em tradução livre).

Esse tipo de inovação chega com desafios. Os modelos, por exemplo, precisam de computadores de altíssima performance. Além disso, para se gerar um vídeo curto são necessárias centenas de imagens.

Isso significa que só grandes empresas do setor de tecnologia seriam capazes de ter esse tipo de ferramenta num futuro próximo.

Tanmay Gupta, cientista e pesquisador no Allen Institute for Artificial Intelligence, disse à revista "MIT Technology Review" que os resultados da Meta são animadores. "Os vídeos mostram que o modelo é capaz de capturar formas em 3D conforme a câmera se move. Também têm alguma noção de profundidade e de iluminação", afirma.

Há, entretanto, bastante espaço para evoluir. É particularmente difícil, afirma ele, modelar interações complexas entre objetos.

"Eu adoraria ver esses modelos tendo sucesso e gerando uma sequência de interações, tipo ‘O homem pega um livro da prateleira, coloca seus óculos e se senta para ler enquanto toma um copo de café’", disse Gupta à revista, exemplificando uma cena que demandaria interação de vários objetos.

Há receio de que, conforme a tecnologia se desenvolva, possa ser usada também como uma poderosa ferramenta para criar e disseminar informações falsas e deepfakes (vídeos falsos, mas extremamente realistas).

"Ao menos por ora, criar conteúdo falso que as pessoas talvez acreditem demanda algum esforço. No futuro, pode ser possível gerar esse tipo de conteúdo apenas apertando algumas teclas", disse o cientista.

Os pesquisadores que criaram o Make-A-Video proibiram imagens e palavras ofensivas no sistema, mas, com bancos de dados gigantes, é quase impossível remover todo o conteúdo potencialmente nocivo.

Um porta-voz da Meta afirma que o modelo, por enquanto, não deve ser disponibilizado ao público. "Como parte da pesquisa, continuaremos a explorar maneiras de mitigar potenciais riscos e aprimorar o modelo", afirmou a empresa.

LINK PRESENTE: Gostou deste texto? Assinante pode liberar cinco acessos gratuitos de qualquer link por dia. Basta clicar no F azul abaixo.

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

Comentários

Os comentários não representam a opinião do jornal; a responsabilidade é do autor da mensagem.