A partir de hoje, minha solução é um aplicativo de miscelânea. PDFBox para extração de PDF e Word Interop para documentos do Word. Ele rasga através deles substitui \ r \ n por "", empurra cada um para um arquivo .txt, então eles estão prontos para serem comparados de uma maneira simples no WinMerge.
Gostaria realmente de algo um pouco mais robusto e oficial ... mas a partir de agora ... esta é a resposta de graça ...