Nos últimos 12 meses, Jean Paoli, presidente-executivo da Docugami, uma startup de inteligência artificial, vem procurando sem parar por aquela que se tornou a mercadoria mais quente da tecnologia: chips de computador.

Em particular, Paoli precisa de um tipo de chip conhecido como unidade de processamento gráfico, ou GPU, porque ele é a maneira mais rápida e eficiente de executar os cálculos que permitem que as empresas de inteligência artificial de ponta analisem enormes quantidades de dados.

Por isso, ele entrou em contato com todo mundo que conhece no setor e que poderia ajudar. Candidatou-se a um subsídio do governo que permite o acesso aos chips. Tentou tornar a tecnologia de inteligência artificial da Docugami mais eficiente, de modo a exigir menos GPUs. Dois de seus cientistas até mesmo reaproveitaram antigos chips de videogames para ajudar.

"Penso neles como um metal de terra rara, no momento", disse Paoli sobre os chips.

Chip usado em inteligência artificial é o produto mais cobiçado por empresas que buscam usar o recurso - Robyn Beck - 04.jan.2023 / AFP

Mais do que dinheiro, talento em engenharia, promoção na mídia ou até mesmo lucros, as empresas de tecnologia este ano estão desesperadas por GPUs. A busca pelo componente essencial foi iniciada no ano passado, quando chatbots online, como o ChatGPT, desencadearam uma onda de entusiasmo com relação à inteligência artificial, levando todo o setor de tecnologia a correr para esse segmento e criando uma escassez de chips. Em resposta, as startups e seus investidores agora estão se esforçando muito para colocar as mãos nos pequenos pedaços de silício e no "poder de computação" crucial que eles oferecem.

A escassez de chips de inteligência artificial foi exacerbada porque a Nvidia, uma fornecedora de chips veterana, exerce virtual controle sobre o mercado. Inundada pela demanda, a empresa do Vale do Silício – cujo valor de mercado subiu para uma avaliação de US$ 1 trilhão - deve divulgar resultados financeiros recordes na semana que vem.

As empresas de tecnologia normalmente compram acesso a chips de inteligência artificial e ao poder de computação que eles oferecem por meio de serviços de computação em nuvem de empresas como Google, Microsoft e Amazon. Dessa forma, elas não precisam construir e operar seus próprios data centers repletos de servidores conectados a equipamentos de rede especializados.

Mas a explosão da inteligência artificial fez com que surgissem longas listas de espera - chegando a quase um ano em alguns casos - para ter acesso a esses chips em empresas de computação em nuvem, criando um obstáculo inesperado em um momento em que o setor de tecnologia não vê nada além de oportunidades e crescimento ilimitado para as empresas que desenvolvem inteligência artificial generativa, capaz de criar suas próprias imagens, textos e vídeos.

Em geral, as maiores empresas de tecnologia conseguem obter GPUs com mais facilidade devido ao seu tamanho, aos seus vastos recursos e às suas posições no mercado. Isso faz com que as startups e os pesquisadores, que normalmente não dispõem desse tipo de relacionamento ou de poder aquisitivo, encontrem dificuldades.

Uma espera sem previsão

O desespero deles é palpável. Nas mídias sociais, em posts de blogs e em debates e conferências, fundadores de startups e investidores começaram a compartilhar dicas altamente técnicas para enfrentar a escassez. Alguns estão apostando sobre quanto tempo eles acham que levará para a lista de espera da Nvidia ser atendida. Há até mesmo uma música sofrível no YouTube, ao som de "We Didn't Start the Fire", de Billy Joel, na qual um artista conhecido como Weird A.I. Yankochip canta "as GPUs são fogo, jamais conseguimos encontrá-las mas queremos comprá-las".

Algumas empresas de capital para empreendimentos, entre as quais a Index Ventures, estão agora usando suas conexões para comprar chips e depois oferecê-los às empresas em que investem. Os empreendedores estão reunindo startups e organizações de pesquisa para comprar e compartilhar um conjunto de GPUs.

Na Docugami, Paoli avaliou a possibilidade de desviar os recursos de GPU da pesquisa e desenvolvimento para o produto da empresa, um serviço de inteligência artificial que analisa documentos. Há duas semanas, ele encontrou ouro: A Docugami garantiu acesso ao poder de computação de que precisava por meio de um programa governamental chamado Access, administrado pela National Science Foundation (NSF), uma agência federal que financia a ciência e a engenharia. A Docugami já havia recebido um subsídio da NSF.

"Essa é a vida de uma startup quando você precisa de GPUs", ele disse.

Quem começa, sofre mais

A falta de chips de inteligência artificial tem sido mais grave para as empresas que estão apenas começando. Em junho, Eric Jonas deixou seu emprego como professor de ciência da computação na Universidade de Chicago para arrecadar dinheiro e abrir uma empresa de descoberta de medicamentos por meio da inteligência artificial. O acesso escasso a GPUs para projetos de pesquisa universitária já era frustrante, mas Jonas ficou chocado ao descobrir que as coisas eram igualmente difíceis para uma empresa iniciante, disse.

"É o Oeste Selvagem", afirmou. "Não há literalmente capacidade alguma".

Evan Conrad e Alex Gajewski, fundadores da San Francisco Compute Group, que compartilha acesso a GPU com pesquisadores - Gabriela Hasbun/The New York Times

Jonas disse que considerou uma série de opções indesejáveis, entre as quais o uso de chips mais antigos e menos potentes e a criação de um data center próprio. Ele também pensou em usar os chips da plataforma de mineração de Bitcoin de um amigo - um computador projetado para fazer os cálculos que produzem a moeda digital -, mas achou que isso daria mais trabalho, pois esses chips não foram programados para o tipo de trabalho exigido pela inteligência artificial.

Por enquanto, Jonas está pedindo favores a amigos em grandes fornecedores de equipamentos e a pessoas que trabalham em empresas de negociação quantitativa de ações e podem ter GPUs extras ou laboratórios de teste que disponham de GPUs que ele possa usar. Ele disse que não precisava de muito - apenas 64 GPUs por seis horas de cada vez.

Essa tensão foi o que recentemente levou dois fundadores de empresas, Evan Conrad e Alex Gajewski, a criar o San Francisco Compute Group, um projeto que planeja permitir que empresários e pesquisadores comprem acesso a GPUs em pequenas quantidades. Depois de trocarem centenas de emails e uma dúzia de ligações telefônicas com empresas de computação em nuvem, fabricantes de equipamentos e corretores, eles anunciaram no mês passado que haviam conseguido 512 chips H100 da Nvidia e que os alugariam para as partes interessadas.

O anúncio ganhou "sucesso viral hilariante", disse Conrad, e resultou em centenas de mensagens de empreendedores, estudantes de pós-graduação e outras organizações de pesquisa.

Conrad e Gajewski agora planejam levantar US$ 25 milhões por meio de um tipo especializado de título de dívida que usa os chips de computador como garantia. O fornecedor, cujo nome os fundadores não quiseram mencionar por receio de que alguém se intrometa e compre as GPUs, prometeu acesso em cerca de um mês.

A dupla disse que esperava ajudar as startups a economizar dinheiro comprando apenas a capacidade de computação necessária para fazer experimentos, em vez de assumir compromissos grandes e de anos de duração.

"Caso contrário, as empresas estabelecidas saem ganhando", disse Conrad.

GPU gratuito

Os investidores de capital para empreendimentos têm um objetivo semelhante. Este mês, a Index Ventures firmou uma parceria com a Oracle para fornecer uma combinação de chips H100 da Nvidia e uma versão mais antiga, chamada A100, às empresas muito jovens de seu portfólio, sem custo algum.

Erin Price Wright, investidora da Index Ventures, disse que a empresa viu suas startups batalhando para navegar pelo complicado processo de obtenção de capacidade de computação e se inscrevendo em listas de espera que chegavam a nove meses. Duas empresas já decidiram usar o novo programa da empresa, e outras manifestaram interesse.

Antes da escassez, George Sivulka, presidente-executivo da Hebbia, fabricante de software de produtividade por inteligência artificial, simplesmente pedia ao seu provedor de nuvem mais "instâncias", ou servidores virtuais repletos de GPUs, à medida que a empresa se expandia. Agora, segundo ele, seus contatos nas empresas de computação em nuvem não respondem às suas solicitações ou o colocam em uma lista de espera de quatro meses. Ele recorreu a clientes e outras conexões para ajudar a apresentar seu caso às empresas de computação em nuvem. E está sempre em busca de mais.

"É quase como falar sobre drogas: ‘Conheço um cara que tem H100s’", ele disse.

Há vários meses, alguns engenheiros da Hebbia montaram um servidor com algumas GPUs menos eficientes no escritório da empresa em Manhattan, colocaram a máquina em um armário e a usavam para trabalhar em projetos menores. Unidades de resfriamento líquido evitam o superaquecimento do servidor, disse Sivulka, mas ele é barulhento.

"Nós mantemos a porta fechada", ele disse. "Ninguém se senta ao lado dele".

A escassez criou um forte contraste entre os que têm e os que não têm. Em junho, a Inflection AI, uma startup de inteligência artificial em Palo Alto, Califórnia, anunciou que havia adquirido 22 mil dos chips H100 da Nvidia. Ela também disse que obteve US$ 1,3 bilhão em investimento da Microsoft, Nvidia e outros. Mustafa Suleyman, presidente-executivo da Inflection, disse em uma entrevista que a empresa planejava gastar pelo menos 95% dos fundos em GPUs.

"Estamos falando de uma quantidade sísmica de computação", ele disse. "É simplesmente de dar água na boca".

Outras startups pediram que ele compartilhasse, ele disse, mas a empresa já está usando toda sua capacidade.