Como posso encontrar fotos duplicadas?

60

O que posso usar para encontrar fotos duplicadas, incluindo fotos que foram redimensionadas?

    
por ændrük 12.09.2010 / 19:01

6 respostas

49

digiKam

Adicione todas as fotos à sua coleção. No menu, selecione “Ferramentas / Encontrar duplicatas”. Isso procurará duplicatas em toda a sua coleção.

findimagedupes

Uma ferramenta de linha de comando. Passe todas as imagens que você deseja comparar na linha de comando.

Geeqie (anteriormente GQview )

No menu, selecione "Arquivo / Encontrar duplicado". Arrastar e soltar arquivos de imagem fazem a janela de duplicatas. Você pode soltar diretórios para adicionar seus conteúdos de forma recursiva. Para comparação visual de imagens, existem opções específicas, não padrão, em um menu suspenso. O nível de similaridade "personalizado" permite restringir os pares apenas ao mais alto grau de similaridade, mas tem que ser definido em "Preferências" como 99. Mesmo assim, ele não funciona perfeitamente, pelo menos para alguns tipos de imagens, como line- arte. Infelizmente, não fornece um mecanismo de seleção automática com critérios racionais, como resolução, data ou qualquer outra coisa, a seleção automática parece apenas aleatoriamente apenas escolher a primeira imagem encontrada como a referência a preservar. A exclusão de muitas imagens pode ser extremamente lenta, pois tenta atualizar a contagem de resultados a cada exclusão.

Todas essas três ferramentas encontram duplicatas visuais, não apenas arquivos com byte idêntico para bytes.

    
por Gilles 12.09.2010 / 21:01
23

FSlint

fslint é um programa gráfico que pode encontrar arquivos duplicados de qualquer tipo pelo md5sum. Se as imagens não forem idênticas, elas não serão marcadas como duplicatas. A imagem abaixo mostra um monte de arquivos pdf duplicados no meu diretório Downloads:

Você pode alterar os parâmetros de pesquisa avançada para pesquisar por tipo de arquivo e restringir-se apenas a imagens. Isso é feito alterando os "parâmetros extras de localização" como opções de comando find . Por exemplo, aqui estou procurando apenas *.jpg files (no mesmo caminho, olhando apenas para a pasta "Downloads":

fdupes

fdupes é uma ferramenta baseada em linha de comando equivalente. Ambos estão disponíveis nos repositórios.

    
por jozzas 12.05.2011 / 03:42
8

fdupes

Você pode usar uma ferramenta de linha de comando chamada fdupes para localizar arquivos duplicados (consulte man fdupes para obter mais detalhes). Não conheço nenhuma maneira de encontrar "duplicatas" que foram redimensionadas. Um programa que fizesse isso exigiria algum tipo de algoritmo inteligente que analisasse o conteúdo da imagem, porque quando uma imagem é redimensionada, seus dados são alterados para que os métodos de busca duplicados tradicionais não funcionem.

    
por dv3500ea 12.09.2010 / 20:21
5

imgSeek

imgSeek pode encontrar duplicatas, bem como imagens semelhantes (para que possa encontrar fotos e fotos redimensionadas com nomes de arquivo e metadados diferentes) e até mesmo pesquisar fotos com base em um esboço. Está disponível nas versões para desktop e servidor.

Eu ainda não tentei por mim mesmo.

    
por d3vid 13.12.2011 / 09:56
3

dupeGuru Picture Edition funciona absolutamente bem, e vale a pena tentar.

Eles têm um PPA do Launchpad , dupeguru (novo pacote all-in-one) ou dupeguru-pe (antigo pacote de edição de imagens) pode ser instalado a partir dele usando esses comandos:

sudo add-apt-repository ppa:hsoft/ppa
sudo apt-get update
sudo apt-get install dupeguru
    
por tuxflo 17.01.2015 / 14:56
1

Visipics

O Visipics é um aplicativo gratuito do Windows para essa função, mas funciona muito bem no Linux, via wine, claro (É melhor que geeqie / gqview sobre a ordenação das duplicatas (os resultados do geeqie são absolutamente "não ordenáveis")) .

Você pode dizer a ele para selecionar automaticamente as imagens com base em critérios como tamanho de arquivo menor, tipo não compactado, resolução mais baixa (ele não fará o contrário, você precisará fazer isso manualmente, o que seria pode ser muito melhor do que fazê-lo no geeqie, exceto que a seleção não requer que você segure Shift / Ctrl ), e até mesmo priorize pastas (mas a última prioridade é pasta prioridade).

No entanto, você deve prestar atenção aos links simbólicos - ele pode selecionar "aleatoriamente" para salvar um link simbólico em um arquivo e, ao mesmo tempo, excluir o arquivo real como uma "cópia". Isso é uma vergonha.

    
por the dsc 22.08.2013 / 05:02