Relacione os arquivos, extraia o tamanho em bytes da lista, classifique-o e conte a ocorrência de todos os tamanhos:
find /my/directory -type f -exec ls -l {} + | cut -d' ' -f5 | sort -n | uniq -c
- não muito eficiente
- se houver muitos arquivos, pode ser melhor salvar os resultados intermediários em um arquivo temporário, classificá-lo em outro arquivo temporário e, em seguida, "uniq"
- aqui eu uso a classificação numérica para que a saída seja ordenada pelo tamanho do arquivo ascendente (legal), mas qualquer tipo será feito contanto que as linhas iguais sejam agrupadas
- canalize os resultados em
awk '{ print $1 "," $2 }'
para obter um arquivo CSV a ser usado em sua ferramenta gráfica de escolha (até as ferramentas de planilha farão)