Eu tenho uma dica de como você pode isolar quais caracteres são:
Salve o documento do Word em um arquivo de texto.
Use um editor hexadecimal para "visualizar" os caracteres ímpares.
Você já usou um editor hexadecimal? Você verá os valores hexadecimais dos caracteres ímpares e, em seguida, precisará procurar esses valores em uma tabela hexadecimal.