Parece-me que ele pode ter começado a vida como um tipo de texto padrão com marcadores de substituição e foi processado por um utilitário que não tinha codificação defensiva suficiente nele - uma variação em este quadrinho xkcd . Pode, por exemplo, ter sido gerado usando um processador XSLT com bugs.
Se é isso que você vê como texto simples, provavelmente não há muito o que fazer além de voltar para a fonte original. Arquivos de texto simples não contêm informações ocultas extras. Uma codificação incorreta pode causar problemas, mas se o seu editor for carregado assumindo uma codificação de byte por caractere e essa codificação estiver errada, você ainda deverá ver mais coisas na forma de caracteres ilegíveis.
Há uma chance de que possa haver um caractere de fim de arquivo ou nulo impedindo que a parte final do texto seja mostrada, mas nenhum editor de texto decente deve ser enganado com isso nos dias de hoje.