Como Siri, Alexa e Google Assistente perderam corrida da inteligência artificial

Assistentes virtuais foram prejudicados por design pesado e erros de cálculo

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

Brian X. Chen Nico Grant Karen Weise
San Francisco e Seattle | The New York Times

Em uma terça-feira chuvosa em San Francisco, executivos da Apple subiram ao palco num auditório lotado para apresentar a quinta geração do iPhone. O aparelho, que parecia idêntico à versão anterior, trazia uma novidade que logo chamou a atenção do público: Siri, uma assistente virtual.

Scott Forstall, então chefe de software, apertou um botão do aparelho para chamar a assistente e lhe fez perguntas. A pedido dele, Siri verificou a hora em Paris ("20h16", respondeu), definiu a palavra "mitose" ("Divisão celular na qual o núcleo se divide em núcleos contendo o mesmo número de cromossomos") e elaborou uma lista de 14 restaurantes gregos altamente cotados, cinco deles em Palo Alto, na Califórnia.

"Estou no campo da IA há muito tempo, e isso ainda me surpreende", disse Forstall.

Ilustração Patrick Edell/The New York Times

Isso foi há 12 anos. Desde então, as pessoas estão longe de se surpreender com a Siri e assistentes concorrentes que são alimentados por inteligência artificial, como a Alexa da Amazon e o Google Assistente. A tecnologia permaneceu praticamente estagnada e os assistentes falantes se tornaram alvo de piadas, inclusive em um esquete do "Saturday Night Live" de 2018 que apresentou um alto-falante inteligente para idosos.

Agora, o mundo da tecnologia está entusiasmado com outro tipo de assistente virtual: os chatbots. Esses bots [diminutivo de "robots", ou robôs] com inteligência artificial, como o ChatGPT e o novo ChatGPT Plus, da empresa OpenAI de San Francisco, podem improvisar rapidamente respostas para perguntas digitadas numa caixa de bate-papo. As pessoas estão usando o ChatGPT para lidar com tarefas complexas, como codificar software, redigir propostas de negócios e escrever ficção.

E o ChatGPT, que usa IA para adivinhar qual palavra virá a seguir, está melhorando rapidamente. Alguns meses atrás, ele não conseguia escrever um haicai adequado; agora pode fazê-lo com orgulho. Na terça-feira (14), a OpenAI revelou seu mecanismo de IA de última geração, o GPT-4, que alimenta o ChatGPT.

A empolgação em torno dos chatbots ilustra como Siri, Alexa e outros assistentes de voz –que antes provocavam entusiasmo semelhante– desperdiçaram sua liderança na corrida da IA.

Na última década, os produtos enfrentaram obstáculos. A Siri esbarrou em empecilhos tecnológicos, incluindo um código desajeitado que levou semanas para ser atualizado com recursos básicos, disse John Burkey, ex-engenheiro da Apple que trabalhou no assistente. A Amazon e o Google calcularam mal como os assistentes de voz seriam usados, levando as empresas a investir em áreas com tecnologia que raramente compensava, disseram ex-funcionários. Quando esses experimentos falharam, o entusiasmo interno pela tecnologia diminuiu, disseram eles.

Os assistentes de voz são "burros como uma pedra", disse Satya Nadella, executivo-chefe da Microsoft, em entrevista este mês ao The Financial Times, declarando que uma IA mais recente abriria o caminho. A Microsoft trabalhou em estreita colaboração com a OpenAI, investindo US$ 13 bilhões (R$ 68,7 bilhões) na startup e incorporando sua tecnologia à máquina de buscas Bing, além de outros produtos.

A Apple não quis comentar sobre a Siri. O Google disse que está comprometido em fornecer um ótimo assistente virtual para ajudar as pessoas em seus telefones e dentro de suas casas e carros; a empresa está testando separadamente um chatbot chamado Bard. A Amazon disse que houve um aumento de 30% no envolvimento dos clientes com a Alexa globalmente no ano passado, e que está otimista sobre sua missão de construir IA de classe mundial.

Os assistentes e chatbots se baseiam em diferentes tipos de IA. Os chatbots são alimentados pelos chamados modelos de linguagem grandes, sistemas treinados para reconhecer e gerar texto com base em enormes conjuntos de dados extraídos da web. Eles podem então sugerir palavras para completar uma frase.

Por outro lado, Siri, Alexa e Google Assistente são basicamente conhecidos como sistemas de comando-e-controle. Eles podem entender uma lista finita de perguntas e solicitações como "Qual é o clima na cidade de Nova York?" ou "Acenda a luz do quarto". Se um usuário pede ao assistente virtual para fazer algo que não está em seu código, o bot simplesmente diz que não pode ajudar.

Siri também tinha um design pesado que consumia muito tempo para adicionar novos recursos, disse Burkey, que recebeu a tarefa de melhorar a Siri em 2014. O banco de dados da assistente contém uma lista gigantesca de palavras, incluindo nomes de artistas musicais e locais como restaurantes, em quase duas dúzias de idiomas.

Isso a tornou "uma grande bola de neve", disse ele. Se alguém quiser adicionar uma palavra ao banco de dados da Siri, acrescentou, "vai para uma grande pilha".

Portanto, atualizações aparentemente simples, como acrescentar algumas frases ao conjunto de dados, exigiriam a reconstrução de todo o banco de dados, o que poderia levar até seis semanas, disse Burkey. Adicionar recursos mais complexos, como novas ferramentas de pesquisa, poderia levar quase um ano. Isso significava que não havia caminho para Siri se tornar um assistente criativo como o ChatGPT, disse ele.

A Alexa e o Google Assistente contavam com tecnologia semelhante à da Siri, mas as empresas tinham dificuldade para gerar receita significativa com os assistentes, disseram ex-diretores da Amazon e do Google —em contraste, a Apple usou a Siri com sucesso para atrair compradores para seus iPhones.

Depois que a Amazon lançou o Echo, um alto-falante inteligente alimentado por Alexa, em 2014, a empresa esperava que o produto ajudasse a aumentar as vendas em sua loja online, permitindo que os consumidores falassem com Alexa para fazer pedidos, disse um ex-líder da Amazon envolvido com a Alexa. Mas enquanto as pessoas se divertiam brincando com a capacidade de Alexa responder a consultas climáticas e definir alarmes, poucos pediram à Alexa para encomendar produtos, acrescentou ele.

A Amazon pode ter investido demais na fabricação de novos tipos de hardware, como despertadores e micro-ondas, agora descontinuados, que funcionavam com a Alexa e eram vendidos a preço de custo ou menos, disse o ex-executivo.

A empresa também investiu pouco na criação de um ecossistema para as pessoas expandirem facilmente as habilidades da Alexa, da mesma forma que a Apple fez com sua App Store, que ajudou a despertar o interesse pelo iPhone, disse a pessoa. Embora a Amazon oferecesse uma loja de "habilidades" para fazer a assistente controlar acessórios de terceiros, como interruptores de luz, era difícil para as pessoas encontrar e configurar habilidades para os alto-falantes –ao contrário da experiência simples de baixar programas para celular em lojas de aplicativos.

"Nunca tivemos um momento App Store para os assistentes", disse Carolina Milanesi, analista de tecnologia de consumo da empresa de pesquisa Creative Strategies e consultora da Amazon.

No final do ano passado, a divisão da Amazon que trabalhava na Alexa foi um dos principais alvos das 18 mil demissões da empresa, e vários executivos importantes deixaram a empresa.

Kinley Pearsall, porta-voz da Amazon, disse que Alexa era muito mais que uma assistente de voz, e "estamos muito otimistas sobre essa missão, como sempre".

Os erros da Amazon podem ter desorientado o Google, disse um ex-gerente que trabalhou no Google Assistente. Os engenheiros do Google passaram anos experimentando seu assistente para imitar o que Alexa fazia, incluindo projetos de alto-falantes inteligentes e telas de tablet sensíveis à voz para controlar acessórios domésticos como termostatos e interruptores de luz. Posteriormente, a empresa integrou anúncios a esses produtos domésticos, que não se tornaram uma importante fonte de receita.

Com o tempo, o Google percebeu que a maioria das pessoas usava o assistente de voz apenas para um número limitado de tarefas simples, como iniciar cronômetros e tocar música, disse o ex-gerente. Em 2020, quando Prabhakar Raghavan, um executivo do Google, assumiu o Google Assistant, seu grupo reorientou o companheiro virtual como um recurso de destaque para smartphones Android.

Em janeiro, quando a controladora do Google demitiu 12 mil funcionários, a equipe que trabalhava em sistemas operacionais para dispositivos domésticos perdeu 16% de seus engenheiros.

Hoje, muitas grandes empresas de tecnologia estão correndo para apresentar respostas ao ChatGPT. No mês passado, a Apple realizou seu encontro anual de IA, um evento interno para os funcionários aprenderem sobre seu grande modelo de linguagem e outras ferramentas de IA, disseram duas pessoas informadas sobre o programa. Muitos engenheiros, incluindo membros da equipe Siri, têm testado conceitos de geração de linguagem toda semana, disseram as pessoas.

Na terça (13), o Google também disse que lançará em breve ferramentas generativas de IA para ajudar empresas, governos e desenvolvedores de software a criar aplicativos com chatbots incorporados e incluir a tecnologia subjacente em seus sistemas.

No futuro, as tecnologias de chatbots e assistentes de voz irão convergir, disseram especialistas em IA. Isso significa que as pessoas poderão controlar chatbots com a voz, e as que usam produtos da Apple, Amazon e Google poderão pedir aos assistentes virtuais para ajudá-las em seu trabalho, não apenas em tarefas como a previsão do tempo.

"Esses produtos não funcionaram no passado porque não tínhamos capacidade de diálogo em nível humano", disse Aravind Srinivas, fundador da Perplexity, startup de IA que oferece um mecanismo de busca baseado em chatbot. "Agora temos."

Tradução de Luiz Roberto M. Gonçalves

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

Tópicos relacionados

Leia tudo sobre o tema e siga:

Comentários

Os comentários não representam a opinião do jornal; a responsabilidade é do autor da mensagem.