Localizando e excluindo imagens antigas não utilizadas?

2

À medida que avançamos em nossos sites baseados em conteúdo, muitas imagens são descartadas em nossa pasta de imagens, mas raramente encontramos alguém que exclua seus arquivos quando não precisar deles, o que significa que acabamos com uma lista enorme de imagens em uma pasta, o que é muito complicado de limpar.

Existe uma ferramenta que me permite descobrir se uma imagem foi solicitada da web nos últimos (n) meses?

Mais geralmente, como você controla as pastas de imagens? Qual política você impõe aos desenvolvedores para limpar? Que medidas você toma para decidir o que acontece e o que fica se você acabar com uma situação fora de controle?

    
por Ayyash 13.04.2010 / 00:57

4 respostas

1

Sua ferramenta de gerenciamento de conteúdo da Web permite que você relate ou consulte quais imagens estão vinculadas no conteúdo do site? Ou você pode executar uma pesquisa de string por extensões de arquivo de imagem nas páginas de conteúdo? Nesse caso, esse relatório combinado com uma lista das imagens dos registros do servidor da Web nos últimos 12 meses (ou mais, dependendo do site) deve ser suficiente para identificar as imagens necessárias. Isso pressupõe que as solicitações de arquivo de imagem apareçam nos logs do servidor. Se você tiver um ambiente de script disponível no servidor, poderá criar scripts para a remoção de imagens não incluídas nessas listas. Você também pode criar uma segunda pasta e mover todas as imagens necessárias e fazer a renomeação descrita.

Claro, faça um backup ou dois primeiro e teste!

Sua outra abordagem, dependendo do tamanho do site, seria adicionar mais armazenamento. Isso pode ser mais barato e mais rápido do que gastar seu tempo pesquisando vários arquivos de imagem. Isso também evita problemas posteriores nos quais as imagens foram vinculadas diretamente de outros sites ou associadas a conteúdo importante, mas usado com pouca frequência.

    
por 13.04.2010 / 01:08
1

por que não executar um script em intervalos fixos para verificar o status do último acesso a arquivos e excluí-los com base no parâmetro de envelhecimento?

você pode avaliar o tempo de acesso em sistemas semelhantes a unix usando find -atime <arg> onde arg é o número de dias com +/- para significar mais ou menos, respectivamente

para que você possa alimentar a saída do find -atime +90 "*.jpg" , por exemplo, para procurar por imagens jpg acessadas pela última vez há mais de 90 dias em um loop for, em que você as alimenta com uma variável $ f e loop com rm command

    
por 30.05.2010 / 09:48
0

Duas maneiras simples de fazer o que você quer.

  1. Analise os registros do servidor da web (por exemplo, usando o Perl) e crie uma lista de arquivos que foram acessados e remova todos os outros. Não é o meu jeito preferido de fazer as coisas.
  2. Analise os links em seu site (se o site estiver construído de uma maneira que torne isso prático) e remova todos os arquivos não vinculados. Muito preferido onde isso é viável, já que leva em conta o conteúdo raramente acessado.
por 13.04.2010 / 07:20
0

Depois de caçar os arquivos de log, acabou o servidor principal IIS não registra nenhum dado devido ao problema de desempenho, e alguns "política"! acabei criando meu próprio log de "watch", onde eu leio todos os pedidos recebidos, verifico se está dentro da pasta images, e abro um arquivo de texto, adiciono o URL da imagem e o urlReferrer, depois de meses, faça um palpite sobre quais pastas devem ser acessadas

agradece a todos por sua opinião sobre isso

    
por 30.05.2010 / 08:21

Tags