Acho que pode não haver um programa existente que faça exatamente o que você deseja. Mas o que você está descrevendo é uma espécie de "análise de conteúdo", semelhante ao que muitos pesquisadores fazem com vários tipos de dados qualitativos. Aqui estão duas listas de pacotes de software destinados a ajudar com esse tipo de tarefa.
Você também pode considerar procurar ferramentas que ajudem você no processo em etapas separadas. Por exemplo, o WFCA ( link ) pode dar-lhe a conta de aparências de palavras nos documentos, mas não mostre-os lado a lado no contexto.
Se você conseguir salvar os arquivos como texto sem formatação em vez do Word, isso poderá aumentar suas opções. Eu posso imaginar o desenvolvimento de uma macro ou script no editor de texto emacs ( link ) que faria algo parecido com o que você quer.