Como descompactar o arquivo em português

0

Eu tenho um arquivo zip contendo dados em português. Quando tento descompactar o arquivo

$ unzip abc.zip

Ele cria um arquivo "abc.csv", mas quando tento analisar os dados, recebo "?" em vez de caracteres como "á". Minhas configurações de LANG no shell se parecem com:

$ locale
LANG=pt_BR.UTF-8
LC_CTYPE="pt_BR.UTF-8"
LC_NUMERIC="pt_BR.UTF-8"
LC_TIME="pt_BR.UTF-8"
LC_COLLATE="pt_BR.UTF-8"
LC_MONETARY="pt_BR.UTF-8"
LC_MESSAGES="pt_BR.UTF-8"
LC_PAPER="pt_BR.UTF-8"
LC_NAME="pt_BR.UTF-8"
LC_ADDRESS="pt_BR.UTF-8"
LC_TELEPHONE="pt_BR.UTF-8"
LC_MEASUREMENT="pt_BR.UTF-8"
LC_IDENTIFICATION="pt_BR.UTF-8"
LC_ALL=

Eu apreciarei qualquer ajuda sobre isso.

    
por ASingh 18.03.2014 / 02:22

1 resposta

1

Provavelmente, você pode culpar seu editor, que não é capaz de entender o formato ISO-8859-1 ou UTF-8. O comando iconv é útil nessas situações; tente converter o arquivo csv nos dois sentidos (ISO-8859-1 - > UTF-8 e UTF-8 - > ISO-8859-1, pois não sei qual é a sua codificação original) e verifique se pelo menos um desses arquivos recém-criados é lido corretamente depois:

$ iconv -f UTF-8 -t ISO-8859-1 abc.csv > abc-latin1.csv

$ iconv -f ISO-8859-1 -t UTF-8 abc.csv > abc-utf8.csv

    
por 18.03.2014 / 03:59