Como posso evitar idiomas quebrados ao descompactar arquivos unicode?

4

Acontece com frequência que vejo nomes de arquivos desconhecidos ao descompactar arquivos zip.

Por exemplo,

 ╕╢╣¤└╟╝║-Bb└╠┴╢╛╟▒т┐ы-┼м╢є╕о│▌,┼╫│╩╗Ў╝╥╞∙ ╝╥╟┴╢є│ы╗Ў╝╥╞∙ ,╞о╖│╞ъ

Qual poderia ser a solução para o problema?

    
por Taeyeon 09.05.2015 / 04:23

4 respostas

4

A codificação MS Windows coreana cp-949 pode ser usada para zipar os arquivos originais. Tente unzip com a opção de codificação do Windows.

unzip -O cp-949 <file.zip>

Observação: verifiquei o perfil do pôster original para saber de onde ele está (Seul, Coreia do Sul). Para outros usuários, você precisa verificar a origem do zip e alterar a codificação, respectivamente.

    
por user.dz 27.05.2015 / 10:18
3

Tente usar o p7zip. (@ Pilot6 mencionou que o p7zip não funciona bem com codificações não UTF-8, mas se você só precisa do UTF-8, então essa é uma solução fácil.)

apt-get update
apt-get install p7zip-full
7z x thefile.zip -o"outputDir"
    
por wisbucky 10.03.2016 / 23:39
0

Se você usar o Ubuntu Archive Manager padrão e o Ubuntu versão 14.04+, isso poderá ser resolvido instalando o Archive Manager corrigido (file-roller). O problema é que o file-roller usa p7zip para descompactar arquivos zip, se o p7zip-full estiver instalado. Mas o p7zip não manipula bem as codificações não-UTF-8. Eu patched file-roller para usar sempre o unzip para esse propósito. O descompactar foi corrigido. O file-roller com patches pode ser instalado a partir do meu ppa

sudo add-apt-repository ppa:hanipouspilot/file-roller
sudo apt-get update
sudo apt-get install file-roller
    
por Pilot6 10.05.2015 / 10:56
0

miniunzip no pacote minizip também parece funcionar bem com nomes de arquivos não-ascii

    
por DWads 07.09.2017 / 08:17

Tags