Como descompactar um arquivo ZIP japonês e evitar mojibake / caracteres ilegíveis

2

Recebi um arquivo ZIP de um cliente japonês.

Quando tento descompactar o arquivo, os nomes das pastas ficam confusos:

$ unzip ~/Downloads/【新入荷ECM】資料.zip
...
 inflating: БyРVУ№Й╫ECMБzОСЧ┐/123_ГЖБ[ГXГPБ[ГX.xlsx

Qual é o problema e como evitá-lo?

    
por Nicolas Raoul 11.07.2017 / 10:21

2 respostas

3

O problema é que a maioria das ZIPs em circulação no Japão tem seu conteúdo codificado como Shift JIS , que não é mostrado corretamente por padrão no Ubuntu.

A solução é usar a opção -O shift-jis em seu comando:

$ unzip -O shift-jis ~/Downloads/【新入荷ECM】資料.zip
...
 inflating: 【新入荷ECM】資料/123_ユースケース.xlsx

Desta forma, os arquivos expandidos são perfeitamente legíveis no Ubuntu.

    
por Nicolas Raoul 11.07.2017 / 10:21
1

Resposta simples para isso

$ sudo apt install unar
$ unar ~/Downloads/【新入荷ECM】資料.zip

unar pode reconhecer automaticamente qual codificação é usada. Apenas extrai e não para compactar.

Em seguida, use ' convmv ' para codificar o texto após o extrato.

$ convmv -f shift_jis -t utf8 БyРVУ№Й╫ECMБzОСЧ┐/123_ГЖБ[ГXГPБ[ГX.xlsx --notest

Por outro lado, se você quiser criar arquivo (s) a partir do utf8 no texto shift_jis para janelas.

$ convmv -f utf8 -t shift_jis <filename> --notest

Respostas alternativas, uso da equipe japonesa do Ubuntu construiu a codificação automática ' unzip ', mas você precisa adicionar o repositório .

    
por Sadaharu Wakisaka 12.07.2017 / 09:10