Por que os mecanismos de pesquisa geralmente mostram um número muito grande de resultados totais? [fechadas]

0

Sempre que você tenta pesquisar algo no google ou em qualquer outro mecanismo de pesquisa, eles incluem o número total de resultados de pesquisa que sempre excedem o valor numérico simples / legível.

Onde o fato que você poderia (possivelmente) descobrir é, existem apenas alguns desses resultados, excluindo todos os links duplicados.

É realmente necessário que eles mentam e façam anúncios falsos?

Eu também gostaria de marcar mais uma pergunta aqui. Como se livrar de links duplicados nos resultados da pesquisa ..?

    
por InfantPro'Aravind' 11.01.2010 / 11:56

2 respostas

7

Os mecanismos de pesquisa, como o Google, não avaliam realmente a consulta. O que eles fazem é avaliar a primeira parte da consulta, o que significa resultados suficientes para exibir a primeira página de resultados.

Isso ocorre porque o Google trabalha com restrições de tempo, precisando gerar um resultado em questão de segundos, enquanto para algumas palavras-chave há conjuntos de resultados apontando para milhões (ou mais) de páginas indexadas.

A contagem total que o Google fornece para o resultado é apenas uma estimativa estatística. Ele é avaliado como uma função do número de resultados encontrados e da fração que o resultado exibido representa do tamanho total dos índices que devem ser processados por todas as palavras-chave. Em outras palavras, se os 20 primeiros resultados envolverem o processamento de 20% dos conjuntos de índices, o Google interromperá o processamento e retornará uma estimativa para um resultado total de 100.

Quando você clica em um resultado, talvez não encontre sua palavra-chave dentro dela. Isso porque, enquanto o Google reindexa todas as páginas, leva muito tempo para rastrear bilhões de páginas da Web. Por isso, se a página tiver mudado, o Google poderá demorar alguns meses para tomar conhecimento da alteração.

    
por 11.01.2010 / 12:45
3

O que se segue é uma simplificação excessiva, mas é muito próximo:

Como existem muitas páginas na internet, não é possível armazenar todas elas em um único servidor. Para contornar isso, o Google tem muitos milhares de rastreadores que rastreiam a Web e armazenam suas descobertas em servidores. Isso significa que as páginas retornadas para sua consulta estão espalhadas em milhares de servidores e que (se vários rastreadores chegarem à mesma página), a mesma página estará em muitos servidores.

Quando você faz sua consulta, o Google pergunta a seus servidores quantas páginas têm correspondência. Mas como existem muitos servidores, não há tempo para ver os resultados exatos de cada um. Por isso, obtém os dez primeiros resultados e manda apenas um número para quantos mais eles têm.

Isso significa que, se o servidor nº 1 tiver a página A e o servidor nº 10 também tiver a página A, o Google relatará isso como dois resultados. Ou, se 10.000 servidores tiverem a página A, o Google informa isso como 10.000 resultados! Esses resultados "falsos" desaparecem quando você clica para ver mais resultados, porque quando apresenta os dez resultados detalhados para você, o Google faz garantir que não haja duplicatas.

Espero que esta explicação faça um pouco de sentido.

Não sei se entendi sua segunda pergunta. O Google "deduz" os links por padrão, portanto, ele nunca mostrará o mesmo link duas vezes no mesmo resultado.

    
por 11.01.2010 / 12:33