Dê uma olhada nisso: link
O MD5 foi o primeiro hash amplamente popular computado em todo o arquivo. Tem alguns problemas graves de segurança, e é por isso que não está mais em uso. Ao ler o MD5 e como ele foi usado, você encontrará as respostas para a maioria, se não para todas as suas perguntas de acompanhamento.
Mas, em termos simplificados, se você tiver qualquer conteúdo a e aplicar uma boa função hash, obterá um valor de hash binário x . Faça qualquer alteração no conteúdo a , independentemente de ser grande ou pequeno, para gerar conteúdo a '. O valor de hash do conteúdo a ' agora é um novo valor de hash x' , com cada bit de x ' tendo 50% de chance de ser diferente do bit correspondente em x .
Claro que isso significa que se você usar um hash de 32 bits, depois de fazer qualquer alteração em a , terá uma probabilidade 2 ^ -32 (0,000000023283%) para obter o mesmo valor de hash. É por isso que os hashes geralmente são maiores que 32 bits.