Se você está procurando por 'duplicatas', e sua métrica é euclidiana, então provavelmente você não precisa saber as distâncias entre objetos distantes. Pesquisando por algo como 'knn eficiente' provavelmente vai te colocar no caminho certo.
Analogia intuitiva: se você está procurando vizinhos a 50km de alguém na Grécia, não gaste muito tempo calculando as distâncias de todas as pessoas nos EUA. Essas distâncias nunca serão importantes para encontrar vizinhos.