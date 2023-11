Nova York | Financial Times

Em sua última teleconferência de resultados como chefe-executivo da empresa de sequenciamento genético Illumina, Francis deSouza fez o possível para se manter positivo.

Uma polêmica aquisição de US$ 8 bilhões (R$ 39 bilhões) da empresa de triagem de câncer Grail provocou uma campanha do investidor ativista Carl Icahn, brigas com autoridades de concorrência dos dois lados do Atlântico e críticas dos diretores fundadores da Grail.

DeSouza disse aos analistas que o drama estava afetando apenas "uma parte muito pequena da empresa".

Um monitor exibe informações de mercado na Bolsa de Nova York, nos Estados Unidos - Andrew Kelly/Reuters

Mas cada vez que lhe perguntavam sobre a Grail, havia mudanças em sua taxa de fala, tom e volume, de acordo com a Speech Craft Analytics, que usa inteligência artificial para analisar gravações de áudio. Também houve um aumento no uso de palavras de preenchimento como "um" e "ah" e até mesmo um engolir audível.

A combinação "revela sinais de ansiedade e tensão especificamente ao abordar essa questão sensível", segundo David Pope, cientista-chefe de dados da Speech Craft Analytics.

DeSouza renunciou menos de dois meses depois.

A ideia de que gravações de áudio poderiam fornecer dicas sobre as verdadeiras emoções dos executivos chamou a atenção de alguns dos maiores investidores do mundo.

Folha Mercado Receba no seu email o que de mais importante acontece na economia; aberta para não assinantes. Carregando...

Muitos fundos já usam algoritmos para vasculhar transcrições de teleconferências de resultados e apresentações de empresas para extrair sinais da escolha de palavras dos executivos - um campo conhecido como "Processamento de Linguagem Natural" ou NLP. Agora eles estão tentando encontrar mensagens adicionais na forma como essas palavras são faladas.

"A ideia é que o áudio captura mais do que apenas o que está no texto", disse Mike Chen, chefe de pesquisa de alfa alternativo na Robeco, gestora de ativos. "Mesmo que você tenha uma máquina semântica sofisticada, ela captura apenas a semântica."

Hesitação e palavras de preenchimento tendem a ser deixadas de fora das transcrições, e a IA também pode captar alguns "microtremores" imperceptíveis ao ouvido humano.

A Robeco, que administra mais de US$ 80 bilhões em fundos impulsionados por algoritmos, tornando-se uma das maiores quantitativas, começou a adicionar sinais de áudio captados por IA em suas estratégias no início deste ano. Chen disse que isso aumentou os retornos e que ele espera que mais investidores sigam o exemplo.

O uso de áudio representa um novo nível no jogo de gato e rato entre gestores de fundos e executivos.

"Encontramos um valor tremendo nas transcrições", disse Yin Luo, chefe de pesquisa quantitativa na Wolfe Research. "O problema que isso criou para nós e muitos outros é que o sentimento geral está se tornando cada vez mais positivo [porque] a administração das empresas sabe que suas mensagens estão sendo analisadas."

Vários artigos de pesquisa descobriram que as apresentações se tornaram cada vez mais positivas desde o surgimento do NLP, à medida que as empresas ajustam sua linguagem para manipular os algoritmos.

Um artigo coescrito por Luo no início deste ano descobriu que a combinação de NLP tradicional com análise de áudio era uma maneira eficaz de diferenciar entre empresas, à medida que suas declarações se tornam cada vez mais "padronizadas".

Embora os custos tenham diminuído, a abordagem ainda pode ser relativamente cara. A Robeco passou três anos investindo em uma nova infraestrutura tecnológica antes mesmo de começar a incorporar a análise de áudio.

Chen passou anos tentando usar áudio antes de ingressar na Robeco, mas descobriu que a tecnologia não estava suficientemente avançada. E embora as percepções disponíveis tenham melhorado, ainda existem limitações.

Para evitar tirar conclusões com base em diferentes personalidades —alguns executivos podem ser naturalmente mais efusivos do que outros— a análise mais confiável vem da comparação de diferentes discursos do mesmo indivíduo ao longo do tempo. Mas isso pode dificultar a avaliação do desempenho de um novo líder —possivelmente um momento em que a visão seria particularmente útil.

"Uma limitação mesmo no NLP é que uma mudança de CEO atrapalha o sentimento geral [análise]", disse um executivo de uma empresa que fornece análise de NLP. "Esse efeito de interrupção deve ser mais forte com a voz."

Os desenvolvedores também devem evitar adicionar seus próprios preconceitos em algoritmos baseados em áudio, onde diferenças como gênero, classe ou raça podem ser mais óbvias do que no texto.

"Somos muito cuidadosos para garantir que os preconceitos conscientes dos quais estamos cientes não sejam incluídos, mas ainda pode haver preconceitos subconscientes", disse Chen. "Ter uma equipe de pesquisa grande e diversificada na Robeco ajuda."

Os algoritmos podem fornecer resultados enganosos se tentarem analisar alguém falando em um idioma não nativo, e uma interpretação que funciona em um idioma pode não funcionar em outro.

Assim como as empresas tentaram se adaptar à análise de texto, Pope previu que as equipes de relações com investidores começariam a treinar os executivos para monitorar o tom de voz e outros comportamentos que as transcrições não captam. A análise de voz tem dificuldades com atores treinados que podem permanecer convincentemente em personagem, mas replicar isso pode ser mais fácil falar do que fazer para os executivos.

"Muito poucos de nós são bons em modular nossa voz", disse ele. "É muito mais fácil para nós escolhermos nossas palavras com cuidado. Aprendemos a fazer isso desde muito jovens para evitar problemas."