Como o arquivo é UTF-8, você pode executar isutf8 . Um pacote adicional de utilitários. Ele fornece linhas, caracteres e offset para bytes inválidos.
Em seguida, use xxd, hexdump ou similar para analisar.
Infelizmente, ele pára no primeiro acidente. Mas, novamente, depende do arquivo. Poderia existe apenas um byte ruim;)
Tem algum código C que faz uma análise semelhante, mas para o arquivo inteiro. Está em um disco em algum lugar há muito esquecido. Poderia tentar encontrá-lo se necessário.
Senão sim, o jeito rápido e não que sujo seria fazer um diff entre uma cópia salva com o gedit - como proposto pelo bom sr. @vonbrand .