IA e empresas de mídia negociam acordos históricos sobre uso de notícias

Google e OpenAI discutem com editores pagamento por uso de material jornalístico para treinar IA

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

Londres, Nova York e Berlim | Financial Times

As maiores empresas de tecnologia do mundo estão discutindo com os principais meios de comunicação acordos importantes sobre o uso de conteúdo de notícias para treinar a tecnologia de IA (inteligência artificial).

OpenAI, Google, Microsoft e Adobe se reuniram com executivos de jornalismo nos últimos meses para discutir questões de direitos autorais relativas a seus produtos de IA, como chatbots de texto e geradores de imagens, segundo várias pessoas informadas sobre as negociações.

'Inteligência artificial' em inglês - Dado Ruvic - 4.mai.2023/Reuters

Essas pessoas disseram que companhias de mídia como News Corp, Axel Springer, The New York Times e The Guardian estiveram em negociações com pelo menos uma das empresas tecnológicas.

Os envolvidos nas discussões, que estão nas etapas iniciais, acrescentaram que os acordos poderão incluir o pagamento de uma taxa de assinatura pelo conteúdo das organizações de mídia, a fim de desenvolver a tecnologia que sustenta chatbots como o ChatGPT, da OpenAI, e o Bard, do Google.

As negociações ocorrem no momento em que os grupos de mídia expressam preocupação pela ameaça à indústria que representa a ascensão da IA, bem como temores sobre o uso de seu conteúdo pela OpenAI e pelo Google sem acordos vigentes. Algumas empresas, como Stability AI e OpenAI, enfrentam ações judiciais de artistas, agências de fotografia e programadores, que alegam violação contratual e de direitos autorais.

Em maio, na conferência de mídia INMA, o executivo-chefe da News Corp, Robert Thomson, resumiu a indignação da indústria, dizendo que "a propriedade intelectual coletiva [da mídia] está ameaçada, e por isso devemos discutir veementemente por compensação".

Ele acrescentou que a IA foi "projetada para que o leitor nunca visite um site de jornalismo, prejudicando fatalmente esse jornalismo".

Um acordo definiria o modelo para as organizações de notícias negociarem com empresas de IA generativa em todo o mundo.

"Os direitos autorais são uma questão crucial para todos os editores", disse o Financial Times, que também está discutindo o assunto.

"Como uma empresa de assinaturas, precisamos proteger o valor de nosso jornalismo e nosso modelo de negócios. Engajar-se num diálogo construtivo com as empresas relevantes, como estamos fazendo, é a melhor maneira de conseguir isso."

Os executivos da indústria de mídia querem evitar os erros do início da era da internet, quando muitos ofereciam artigos online gratuitamente que acabavam prejudicando seus modelos de negócios. Grandes grupos de tecnologia, como Google e Facebook, acessaram essas informações para ajudar a construir negócios multibilionários de publicidade online.

À medida que a popularidade da IA generativa cresceu, também aumentaram as preocupações da indústria jornalística, dada a capacidade da tecnologia de produzir trechos convincentes de texto semelhante ao humano.

O Google anunciou recentemente uma função de pesquisa generativa, que retorna um quadro de informações escritas por IA acima de seu formato tradicional de links da web. Ele foi lançado nos Estados Unidos e está em preparativos para lançamento mundial.

Algumas discussões atualmente envolvem a tentativa de encontrar um modelo de precificação para conteúdo noticioso usado como dados de treinamento para modelos de IA. Um número que foi discutido pelos editores é de US$ 5 milhões (R$ 24,1 milhões) a US$ 20 milhões (R$ 96,6 milhões) por ano, de acordo com um executivo do setor.

Mathias Döpfner, executivo-chefe da Axel Springer, dona do site Politico, que se reuniu com as principais companhias de IA –Google, Microsoft e OpenAI–, disse que sua primeira escolha seria criar um modelo "quantitativo" semelhante ao desenvolvido pela indústria da música, em que estações de rádio, casas noturnas e serviços de streaming pagam às gravadoras cada vez que uma faixa é tocada. Isso exigiria primeiro que as empresas de IA divulgassem seu uso de conteúdo de mídia, o que atualmente não fazem.

Döpfner, cuja empresa de mídia com sede em Berlim também é dona do tabloide alemão Bild e do jornal Die Welt, disse que um acordo anual para uso ilimitado do conteúdo de um veículos de mídia seria uma "segunda melhor opção", porque esse modelo seria mais difícil para pequenas empresas regionais ou agências de notícias locais se aproveitarem.

"Precisamos de uma solução para todo o setor", disse Döpfner. "Temos que trabalhar juntos nisso."

O Google tem liderado as negociações com os meios de comunicação do Reino Unido, reunindo-se com o Guardian e o NewsUK. A empresa de propriedade da Alphabet tem antigas parcerias com várias organizações de mídia para usar dados de conteúdo, como artigos, para garantir que seja otimizado para aparecer em seu mecanismo de pesquisa.

A empresa usou os dados para treinar seus grandes modelos de linguagem, conforme duas pessoas informadas sobre o arranjo.

"O Google colocou na mesa um acordo de licenciamento", disse um executivo de um grupo jornalístico. "Eles aceitaram o princípio de que precisa haver pagamento [...], mas não chegamos ao ponto de falar em números. Eles reconheceram que há uma conversa sobre dinheiro que precisamos ter nos próximos meses, que é o primeiro passo."

Depois que este artigo foi publicado pela primeira vez, o Google disse que o comentário do executivo de mídia sobre um possível acordo de licenciamento "não é exato. É muito cedo e continuamos trabalhando com o ecossistema, incluindo os editores de notícias, para ouvir suas ideias".

O Google não comenta discussões financeiras. No entanto, a empresa de buscas na internet disse que está tendo "conversas contínuas" com veículos de notícias, grandes e pequenos, nos Estados Unidos, Reino Unido e Europa, e já treinou sua IA em "informações publicamente disponíveis", que podem incluir sites com acesso pago.

O gigante do Vale do Silício acrescentou que está considerando a opção de dar aos editores mais "escolha e controle" sobre se seu conteúdo faria parte de um conjunto de dados de treinamento para IA, assim como permite que os sites desativem seu conteúdo que é usado nas buscas.

Desde o lançamento do ChatGPT, em novembro, o chefe da OpenAI, Sam Altman, se se reuniu com a News Corp e o The New York Times, segundo pessoas familiarizadas com as discussões. A empresa reconheceu que manteve conversas com editoras e associações de publicação em todo o mundo sobre como poderiam trabalhar juntos.

Desenvolver um modelo financeiro para o uso de conteúdo de notícias para treinar IA será extremamente difícil, dizem líderes editoriais. Executivos seniores de uma grande editora dos Estados Unidos afirmaram que a indústria jornalística está trabalhando retroativamente porque as empresas de tecnologia lançaram esses produtos sem consultá-los.

"Não houve discussão, e agora temos que tentar receber depois que aconteceu", disse o executivo. "A forma como eles lançaram esses produtos, o sigilo total, o fato de não haver transparência, nenhuma comunicação antes de acontecer, há motivos para ser bastante pessimista."

A analista de mídia Claire Enders disse que as negociações estão "muito complicadas no momento", acrescentando que, como cada organização adota sua própria abordagem, um único acordo comercial para grupos de mídia é improvável e pode ser contraproducente.

Enders acrescentou: "Os chatbots não serão ferramentas confiáveis se forem literalmente treinados basicamente nos esgotos da misoginia e do racismo que compõem a maior parte do texto aberto e acessível".

As empresas de tecnologia que estão construindo a IA estão empenhadas em focar sua utilidade para produzir eficiência nas redações e aprimorar o jornalismo, e se contentam em pagar milhões para preservar antigos relacionamentos com a indústria, disseram pessoas envolvidas nas negociações.

Brad Smith, vice-presidente da Microsoft, disse que estava "nos primeiros dias de conversas com a mídia e editores, e parte disso é apenas ajudar todos a aprender como os modelos são treinados".

"Acho que nossa maior oportunidade é realmente trabalhar primeiro com os editores para pensar em como eles podem usar a IA para gerar mais receita", acrescentou.

O executivo-chefe da Adobe, Shantanu Narayen, disse que teve reuniões com a Disney, a Sky e o Daily Telegraph do Reino Unido nas últimas semanas para discutir como poderia desenvolver modelos personalizados para as empresas usarem sua IA generativa para imagens.

O modelo da Adobe é treinado em imagens de sua própria biblioteca de imagens, bem como em conteúdo de licença aberta e de domínio público, cujos direitos autorais expiraram. Narayen disse que acordos sob medida e preços dependeriam da empresa, mas os clientes poderiam adicionar seu conteúdo proprietário à ferramenta.

Döpfner, da Axel Springer, expressou otimismo de que haverá acordos, porque tanto as organizações de mídia quanto os formuladores de políticas compreenderam a escala do desafio mais rapidamente do que durante a última grande onda de disrupção tecnológica.

As empresas de IA sabem que a regulamentação está chegando e têm medo dela, disse ele. "É do interesse de todas as partes encontrar uma solução para um ecossistema saudável. Se não houver incentivo para criar propriedade intelectual, não há nada para começar. A inteligência artificial se tornará estupidez artificial".

Tradução de Luiz Roberto M. Gonçalves

Cristina Criddle , Madhumita Murgia , Daniel Thomas , Anna Nicolaou e Laura Pitel
  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

Tópicos relacionados

Leia tudo sobre o tema e siga:

Comentários

Os comentários não representam a opinião do jornal; a responsabilidade é do autor da mensagem.