É algo que não se parece com utf-8 ou iso-8859-1. Pode ser qualquer outra coisa. Pode até não ser um texto. Esse tipo é uma espécie de descrição de fall-back para qualquer coisa que não contenha zero bytes.
Mesmo que na verdade seja um arquivo de texto (a extensão sugere que possa ser), infelizmente não existe uma maneira automática de descobrir a codificação, porque a maioria das codificações tem o mesmo intervalo de códigos válidos. O Utf-8 pode ser distinguido com muita confiança, mas além disso requer verificação manual.
Primeiro, você precisa descobrir em que idioma o arquivo está para ter uma ideia do conteúdo correto e do conteúdo ilegível e para ter uma lista de possíveis codificações. Porque existem zilhões de codificações, mas apenas alguns foram usados para qualquer idioma em particular.
Do que você precisa para tentar converter o arquivo de cada codificação possível e para cada conversão que tenha sucesso tecnicamente (que infelizmente será a maioria deles), visualize o resultado e verifique se está correto ou não.
Um corretor ortográfico pode ajudar você com a revisão, pois conversões incorretas levarão a mais erros do corretor ortográfico.
Para a conversão, você pode usar iconv
(1) , que é instalado a partir do pacote libc em GNU / Linux ou recode
. recode
tem mais opções e melhor tratamento de erros.