Simian faz o que você está procurando. Ele ainda permite que você defina limites para capturar pedaços de texto idênticos cada vez menores. Não é código aberto, mas a licença permite que seja usado gratuitamente para avaliação e uso não comercial.
Eu quero procurar por blocos duplicados de texto dentro do documento mesmo . Ferramentas como WinMerge e Beyond Compare não parecem fazer isso.
Alguém sabe de um utilitário que pode fazer isso?
Simian faz o que você está procurando. Ele ainda permite que você defina limites para capturar pedaços de texto idênticos cada vez menores. Não é código aberto, mas a licença permite que seja usado gratuitamente para avaliação e uso não comercial.