Meu problema é semelhante a este mas as soluções não funcionaram para mim.
Eu tenho um arquivo csv identificado como application/octet-stream; charset=binary
via file -i
.
Eu usei vários comandos para examinar esse arquivo ( head
, xxd -b
, hexdump -C
, less
, od -bc
), mas nenhum deles mostrou qualquer BOM ou bytes nulos. Apenas começa como texto simples ( ASCII
/ UTF-8
) e é exibido corretamente. enca -L none
me diz que é UTF-8
.
Por que file -i
falha?
EDIT: Mesmo que o problema com file -i
ainda exista, agora uso uma solução alternativa com o mencionado enca -L none
, que me fornece a codificação correta.