Índice geral Tec
Tec
Texto Anterior | Próximo Texto | Índice | Comunicar Erros

A Anatomia de uma busca

Veja como funciona um buscador tradicional e o que muda com a semântica

PARTE 1:
Encontrando, guardando e selecionando informações

GARIMPO
Continuamente, um programa percorre bilhões de páginas da web, copiando e arquivando os conteúdos em servidores

RANKING
O Google diz usar 200 atributos para definir a relevância de uma página. Um dos principais é um ranking a partir do número de links que uma página recebe

A posição no ranking de quem direciona os links também influencia no resultado. Quanto mais links de fontes em posições altas, melhor a colocação no ranking de uma página

ÍNDEX
As informações são organizadas em um índex, como o índice de um livro. É criada uma lista com todas as palavras de uma página na web e a localização delas

PARTE 2:
Humanos entram em ação

CURIOSO
O usuário entra no site e digita no campo de buscas palavras-chave relacionadas àquilo que ele procura. Imagine alguém que busque por "Copa do Mundo"

COMPARAÇÃO
O buscador procura as palavras digitadas (no caso, "Copa do Mundo") em sua lista, o índex, e localiza todas as páginas da web em que o termo aparece

REFINAMENTO
O ranking determina quais resultados são relevantes para o usuário, eliminando informações que considera desnecessárias

Em tese, a página que aparece no topo dos resultados de busca é a líder do ranking daquelas palavras-chave

Na busca por "Copa do Mundo", o Google demorou 0,3 segundo para apresentar uma lista de 22,8 milhões de resultados, misturando sites de esportes, de turismo e de entidades. O líder da lista foi o verbete "Copa do Mundo Fifa" na Wikipédia. O site da Fifa apareceu em terceiro

PARTE 3:
Futuro

MUDANÇA
Buscas semânticas deixam um pouco de lado as palavras-chave e as listas com milhões de resultados.

Ao buscar por "Copa do Mundo", o buscador poderia, por exemplo, apresentar, sem precisar indicar sites, uma lista com campeões do torneio, times classificados para a próxima edição e datas dos jogos em 2014

CONTEXTO
Localização e hábitos de navegação do usuário, data e buscas de outras pessoas, entre outros indicadores, podem ser usados na procura pela melhor resposta

O número de páginas provavelmente seria menor e mais moldado ao perfil do usuário. Em alguns casos, o buscador tentaria responder a perguntas diretamente

SEMÂNTICA
Além das palavras-chave, os sinônimos delas entram na fórmula da relevância, ainda que não tenham sido digitadas. A ideia é que o buscador tenha o entendimento mais próximo ao de um ser humano

Ao digitar "Copa do Mundo", o software poderia também identificar páginas importantes onde aparecem com destaque palavras como "Campeonato Mundial" e "futebol" (mesmo que "Copa do Mundo" não aparecesse)

Texto Anterior | Próximo Texto | Índice | Comunicar Erros


Copyright Empresa Folha da Manhã S/A. Todos os direitos reservados. É proibida a reprodução do conteúdo desta página em qualquer meio de comunicação, eletrônico ou impresso, sem autorização escrita da Folhapress.