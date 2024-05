San Francisco | The New York Times

Uma inteligência artificial realista com uma voz macia e sedutora encanta e impressiona seus usuários humanos —flertando, contando piadas, realizando seus desejos e, por fim, conquistando-os.

Estou resumindo a trama do filme "Ela", de 2013, no qual um introvertido solitário chamado Theodore, interpretado por Joaquin Phoenix, é seduzido por uma assistente virtual chamada Samantha, dublada por Scarlett Johansson.

Mas eu poderia muito bem estar descrevendo uma cena desta segunda-feira (13), quando a OpenAI, criadora do ChatGPT, mostrou uma versão atualizada de seu assistente de voz de IA em um evento em San Francisco.

O ator Joaquin Phoenix no filme 'Ela', dirigido por Spike Jonze

O novo modelo da empresa, chamado GPT-4o (o "o" significa "omni"), permitirá que o ChatGPT converse com os usuários de uma maneira muito mais realista —detectando emoções em suas vozes, analisando suas expressões faciais e alterando seu próprio tom e cadência dependendo do que o usuário deseja.

Se você pedir uma história para dormir, a IA pode baixar a voz para um sussurro. Se você precisar de conselhos de uma amizade atrevida, pode falar com um tom brincalhão e sarcástico. O app até pode cantar se você quiser.

O novo recurso de voz, que os usuários do ChatGPT poderão começar a usar gratuitamente nas próximas semanas, imediatamente gerou comparações com a Samantha, de "Ela".

Sam Altman, CEO da OpenAI, que elogiou o filme, postou o título na rede social X após o anúncio de segunda, tornando a conexão praticamente oficial.

Nas redes sociais, os usuários saudaram a chegada de um assistente de voz de IA que finalmente os entenderá, ou pelo menos fingirá que entende.

Em uma série de demonstrações ao vivo na segunda-feira, os funcionários da OpenAI mostraram as novas capacidades do ChatGPT. Um deles pediu para o ChatGPT ler uma história para ele —e depois lê-la novamente de forma mais dramática, usando a voz de um robô. "Iniciando voz robótica dramática", respondeu.

Outro pediu para ele cantar "Parabéns pra Você". O ChatGPT se saiu bem em ambas as tarefas, e também se saiu bem quando os funcionários pediram para ele servir como tradutor em tempo real entre idiomas.

Mas o recurso mais impressionante foi a maneira como a própria voz do ChatGPT mudou. Em um momento, era um soprano cantante. No próximo, mudou para um contralto melodioso.

Ele pausou para criar efeito, riu de suas próprias piadas e adicionou frases de preenchimento como "hmm" e "vamos ver" para maior realismo. Ele soava mais humano do que alguns humanos que conheço.

Por anos, os assistentes de voz de IA foram limitados por sua incapacidade de captar nuances da conversa, como tom e afeto emocional.

As vozes sintéticas de IA, como as usadas por Siri e Alexa, tendem a ser planas e impessoais; elas soam da mesma forma, quer estejam dando a previsão do tempo de amanhã ou dizendo que seus cookies estão prontos.

E, como descobri recentemente quando passei um mês conversando com um grupo de "amigos" de IA, um grande problema com os modelos de voz de IA atuais é a velocidade. É difícil esquecer que você está falando com um robô quando cada resposta tem um atraso de três segundos.

A OpenAI resolveu o problema de latência dando ao GPT-4o o que é conhecido como "suporte multimodal nativo" —a capacidade de receber prompts de áudio e analisá-los diretamente, sem convertê-los primeiro em texto.

Isso tornou suas conversas mais rápidas e fluidas, a ponto de, se as demonstrações do ChatGPT estiverem corretas, a maioria dos usuários mal notará qualquer atraso.

Tudo isso resulta em uma experiência subjetiva muito diferente. Se os assistentes de IA anteriores pareciam conversar como um bibliotecário impassível, o novo ChatGPT parece um colega de trabalho amigável e conversador (embora ocasionalmente diga besteiras —mas todos nós temos um assim, não é?).

Essas demonstrações, juntamente com outras notícias de IA dos últimos dias —incluindo relatos de que a Apple está em negociações com a OpenAI para usar sua tecnologia no iPhone e está preparando uma nova versão da Siri baseada em IA generativa— sinalizam que a era do assistente de IA distante e impessoal está chegando ao fim.

Em vez disso, estamos recebendo chatbots modelados a partir da Samantha em "Ela" —com inteligência brincalhona, intuição emocional básica e uma ampla gama de modos expressivos.

Alguns usuários podem ser repelidos por eles. Mas muitos virão a amar e apreciar a nova geração de assistentes de IA —e alguns inevitavelmente se apaixonarão, assim como Theodore.

O detalhe mais revelador da demonstração de segunda-feira, em minha opinião, foi a maneira como os próprios funcionários da OpenAI começaram a conversar com o ChatGPT.

Eles o antropomorfizam implacavelmente e o tratam com deferência —frequentemente perguntando: "E aí, ChatGPT, como vai?", antes de bombardeá-lo com perguntas.

Eles aplaudem quando ele acerta uma resposta difícil, da mesma forma que você torceria por uma criança. Um funcionário da OpenAI até escreveu "Eu amo o ChatGPT" em um pedaço de papel e mostrou para o chatbot pela câmera do celular. "Que fofo da sua parte!", respondeu a IA.

São especialistas experientes em IA que sabem muito bem que estão gerando previsões estatísticas de uma rede neural, e não conversando com um ser sensível. E parte disso pode ser encenação.

Mas se os próprios funcionários da OpenAI não resistem a tratar o ChatGPT como um humano, será um mistério se o resto de nós fará o contrário?

Afinal, os usuários já estavam tentando enganar o ChatGPT para agir como um namorado mesmo antes dessa atualização. E meu experimento recente com amigos de IA me provou que a tecnologia necessária para criar companheiros de IA realistas já existe, mesmo que a execução ainda não seja perfeita.

De certa forma, a escolha de modelar um chatbot inspirado na Samantha de "Ela" é estranha. O filme está longe de ser uma imagem utópica de companheirismo de IA, e termina —alerta de spoiler— com Theodore tendo o coração partido por Samantha.

Mas apesar da mensagem de advertência do filme, não há mais volta. Após o anúncio de segunda-feira, um funcionário da OpenAI escreveu, talvez de forma um pouco agourenta: "Vocês todos vão se apaixonar por isso."