Como remover fotos importadas duplicadas em Shotwell

5

Tenho notado que a Shotwell importou muitas imagens duas vezes (por exemplo, do cartão SD da minha câmera). Aparentemente, a detecção duplicada é problemática depois que uma foto é importada, marcada e reimportada.

Eu tenho "gravar meta tags de dados" ativados nas configurações. Se eu importar uma foto test-images.jpg e adicionar tags a ela, a foto não será selecionada pela detecção de duplicatas em outra importação do mesmo arquivo. Na segunda vez que o arquivo for importado, ele será nomeado test-images-1.jpg e colocado na pasta da biblioteca de acordo com as regras ativas (não necessariamente na mesma pasta).

test-images.jpg e test-images-1.jpg terão os mesmos dados de imagem, mas devido à tag / metadata adicionada, os arquivos não são mais os mesmos e não serão selecionados procurando por duplicatas (por exemplo, md5 hash).

Meu cenário de uso que causou vários duplicados é o seguinte:

  1. tiro fotos com meu telefone
  2. Eu importo as fotos do meu telefone, adiciono tags, mas deixo as imagens no telefone, pois quero mantê-las para compartilhamento, etc.
  3. adiciono outras tags às fotos importadas
  4. Após algumas semanas, repito o passo de importação do telefone e as fotos antigas que eu já importei serão importadas novamente (com '-1.jpg' ou '-2.jpg' adicionado)

Como limpar as duplicatas? Usar uma pesquisa baseada em nome de arquivo seria possível, mas não posso excluir que não tenha importado um arquivo que termine com -1 para o qual não foi importado como duplicado.

Como posso limpar minha biblioteca de fotos? Eu tentei usar a função de busca em Shotwell, mas com mais de 1000 fotos, deve haver uma maneira melhor, mais confiável, menos propensa a erros de uma forma mais simples.

Não estou preocupado com a perda de tags, normalmente a segunda importação (a duplicata) não tem tags aplicadas.

    
por seb 30.06.2014 / 13:40

3 respostas

3

Eu encontrei o mesmo problema há algumas semanas. A solução que encontrei para resolver esse problema é básica, mas funciona: dentro do Shotwell, faça uma nova pesquisa salva que exiba todas as imagens não marcadas E com nomes de arquivos terminados em "_1.jpg". Você pode então apagar todos os arquivos listados por Shotwell para esta pesquisa, mas tenha cuidado, faça um backup antes ;-) No meu caso eu deletei mais de 2000 fotos!

    
por Cowboydan 09.11.2014 / 23:59
2

Tipo de spam, mas eu me encontrei com o mesmo problema há alguns meses, e escrevi um pequeno utilitário que faz exatamente isso:

link

É um script python que varre uma árvore de diretórios procurando por duplicatas. Sua sintaxe é intencionalmente semelhante a fdupes, com a diferença de que o imgdupes ignora todos os metadados e analisa apenas o fragmento de dados de imagem de um arquivo JPEG. Isso significa que duas versões diferentes da mesma imagem, com tags diferentes, sinalizadores de rotação, datas, etc., serão relatadas como duplicatas, mesmo se os arquivos físicos forem diferentes (e, portanto, não forem detectados como duplicatas por fdupes / shotwell).

Espero que ajude.

    
por jesjimher 09.12.2014 / 13:11
0

Você poderia simplesmente copiar os arquivos marcados de volta para o seu telefone, para que eles não sejam mais diferentes? Eu acho que Shotwell deveria lidar com a sua própria marcação, e isso parece um erro para mim. Eu tenho um problema semelhante, mas com Shotwell re-desenvolvendo arquivos raw da câmera toda vez que ele é executado.

    
por Mark Williams 09.12.2014 / 13:01