O arquivo Txt contém caracteres bin que não são renderizados corretamente no vim

3

O arquivo txt com o conteúdo é aberto corretamente no editor da GUI (estou usando o sublime). Mas no vim, aparece assim, agora não consigo fazer o grep nesse arquivo. Quando eu uso menos, ele diz "pode ser um arquivo binário". Como faço para converter isso para arquivo de texto adequado. Alguma idéia de por que esses personagens estranhos estão aparecendo?

Y ^ o ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ r ^ @ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ @ ^ ^ ^ @ ^ ^ ^ ^ ^ @ a ^ @ g ^ @ e ^ @ n ^ @ c ^ @ y ^ @ n ^ @ a ^ @ m ^ @ e ^ @ | ^ @ c ^ @ r ^ @ s ^ @ i ^ @ d ^ @ | ^ @ ^ ^ ^ @ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ i ^ @ t ^ @

    
por Anjesh 18.04.2014 / 07:22

1 resposta

6

Parece um arquivo de texto simples armazenado em Unicode UTF-16 LE, onde cada ponto de código Unicode é armazenado como uma ou duas unidades de código de 16 bits.

Se o texto em si é principalmente ASCII (todos os pontos de código ≤ U + 00FF), o resultado parece que um byte NUL foi inserido após cada byte, se você estiver visualizando o arquivo de um editor incapaz de UTF-16 .

Na linha de comando, use iconv -f utf-16le -t utf-8 < file.txt > file-new.txt para corrigi-lo.

No Vim, você pode usar :e ++enc=utf-16le para reabrir o arquivo usando a codificação correta.

Se possível, diga ao Sublime para salvar arquivos como UTF-8 , o que será muito mais compatível com várias ferramentas. (No Vim: :set fileencoding=utf-8 | w )

    
por 18.04.2014 / 07:41

Tags