Descrição de chapéu internet tecnologia

Nova ferramenta do Google transforma anotações e documentos em 'podcast'

NotebookLM já usava inteligência artificial para produzir resumos em texto a partir dados fornecidos pelo usuário

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

São Paulo

O Google lançou nesta quarta-feira (11) uma ferramenta que converte documentos fornecidos pelo usuário em áudio simulando uma conversa entre duas pessoas, no estilo podcast.

A função foi implementada no NotebookLM, bloco de notas com IA da big tech apresentado em 2023 e disponível no Brasil desde junho de 2024.

Google lançou ferramenta de conversão de documentos em áudios de conversa
Google lançou ferramenta de conversão de documentos em áudios de conversa - Divulgação/Google

Na interface, usuários criam projetos e os alimentam com diferentes tipos de documentos. O NotebookLM sugere algumas opções prontas de processamento, como a produção de uma linha do tempo com base nos acontecimentos encontrados nos documentos e um sumário com os termos mais importantes.

Agora, a IA também gera um áudio que simula dois locutores conversando sobre o assunto tratado na base de fontes do projeto. A novidade só está disponível em inglês, apesar de o NotebookLM processar documentos em português, segundo testes feitos pela Folha.

Os "anfitriões de IA" foram programados para exibir comportamento arrojado e fazer brincadeiras, de acordo com o Google. Uma publicação no site da empresa mostra um áudio gerado a partir de um texto sobre o uso do NotebookLM para a checagem de fatos, feito pelo próprio blog da companhia.

Na peça, a primeira voz gerada por IA inicia a conversa dizendo: "Você já se sentiu como se estivesse se afogando em informação com artigos, PDFs e sites prometendo, tipo, revelar os segredos do universo?"

A outra voz responde: "Ou pelo menos terminar aquele projeto de pesquisa que você está adiando".

"Exato. É tipo beber de uma mangueira de incêndio", continua a primeira voz, enquanto a segunda ri.

O Google afirma que o usuário é livre para baixar o áudio e transferi-lo para qualquer lugar. A tecnologia usa recursos do modelo Gemini 1.5 Pro, e foca somente nas informações fornecidas em cada sessão para produzir respostas personalizadas. A orientação para que o modelo não se baseie em informações externas reduz o risco de alucinação, de acordo com a companhia.

Dados colocados em projetos do NotebookLM não são usados para treinar modelos de IA. A plataforma conta com moderação humana a partir de amostras aleatórias.

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

Tópicos relacionados

Leia tudo sobre o tema e siga:

Comentários

Os comentários não representam a opinião do jornal; a responsabilidade é do autor da mensagem.