Removendo caminhos / páginas de entrada dos resultados da pesquisa do SharePoint

3

Fomos solicitados por um cliente para remover um número de páginas da exibição na página de resultados de pesquisa do website público. Participei do SSP e criei as regras de rastreamento para remover essas páginas. Tudo parecia ter funcionado bem, mas temos um problema em que as páginas de destino ainda estão aparecendo em seu formulário "www.domain.com/sitearea/", mas não em "www.domain.com/sitearea/pages/default.aspx". ".

Para cada um desses tipos de página, criamos uma regra para "Excluir" o caminho "aspx" e outra regra para incluir o caminho "/", mas para "Seguir links no URL sem rastrear o próprio URL". Tentamos adicionar regras para excluir o formato "/", mas isso resultou em apenas todos os resultados abaixo dele.

Alguém sabe como remover o "área / páginas / default.aspx" e o "área /" tapinhas dos resultados da pesquisa?

Eu não tenho certeza se é a "coisa feita" para fazer 2 perguntas em uma, mas isso é de uma forma similar, então deve ser ok. Eu queria saber se alguém sabia de uma ferramenta (ou se é possível) para permitir que os administradores do site excluam as páginas dos resultados de pesquisa (não por SSP / regras de rastreamento). Eu sei que eles podem fazer isso no nível do site, mas eu estava me perguntando se alguma coisa lá fora permitia que isso fosse feito no nível da página através de Página ou Configurações do Site?

    
por j.strugnell 30.09.2009 / 12:53

5 respostas

1

Não tenho certeza se entendi: estamos falando de excluir páginas de mecanismos de pesquisa públicos como o Google ou de uma função interna de pesquisa específica do SharePoint?

Bem, em ambos os casos, o robots.txt deve funcionar para excluir as páginas da Web da indexação pelos mecanismos de pesquisa. Não sou especialista em SharePoint, mas um rápido googling parece mostrar que o SharePoint Search obedece ao robots.txt, então essa seria minha primeira escolha.

Aqui está a principal documentação para o formato de robots.txt . Este documento da Microsoft parece descrever o gerenciamento do Sharepoint Search muito bem. Diz:

SharePoint Portal Server 2003 and SharePoint Server 2007 automatically obey the restrictions that are contained in the Robots.txt file.

- o que, mais uma vez, significa que o SharePoint Search obedecerá a um arquivo robots.txt.

Se o seu site for acessível publicamente, convém abrir uma conta das Ferramentas do Google para webmasters . Eles têm algumas boas ferramentas para solucionar vários problemas de rastreamento e ver como o robots.txt funcionará no seu site.

    
por 31.10.2009 / 19:10
1

Se você deseja excluir todas as páginas, como "área / páginas / default.aspx" e "área /", a regra de exclusão de rastreamento precisa ter um asterisco no final, ou seja, www.domain.com/sitearea/*

    
por 12.01.2010 / 03:24
1

Estou tendo um problema de tipo semelhante, o indexador está incluindo itens de navegação na pesquisa, mas apenas para objetos STS_Web ... ou eles devem ser objetos STS_Web ... os recursos de publicação do WCM no SharePoint parecem marcar as boas-vindas páginas como STS_ListItem_850 ... não STS_Web ... a URL nos resultados da pesquisa é o URL da Web e não o URL da página (exclui o Pages / Default.aspx) está indexando a página de boas-vindas como a Web e não a própria Web.

    
por 14.01.2011 / 11:53
0

Tente criar um escopo de pesquisa com regras baseadas na propriedade contentclass. Todos os sites usam o valor sts_site e webs sts_web . Remover qualquer contentclass com esses valores deve impedir que a versão site/ das homepages apareça.

    
por 01.10.2009 / 00:09
0

Eu adicionei um URL é a remoção do resultado da pesquisa - para não aparecer na página de resultados de pesquisa. Não o requisito mudou e os resultados devem ser mostrados novamente .. como recuperá-lo ..

    
por 06.11.2009 / 07:23