Se houver a necessidade de fazer interpolações e redimensionar, há espaço para erros, e imagens similares (resolução diferente) podem ser marcadas como duplicadas. Há, portanto, a necessidade de verificação humana.
Dê uma olhada em imagemagick . A página da Web parece antiga, mas ainda é boa.