Corrigir nomes de arquivos Unicode corrompidos em um arquivo zip

3

Um colega me deu um arquivo zip de alguns dados que eu preciso analisar, mas infelizmente os nomes de arquivos foram corrompidos em algum lugar ao criar o arquivo ou ao extraí-los na minha máquina.

O arquivo contém 3000 arquivos cujos nomes de arquivos contêm caracteres japoneses. Ele fechou em uma máquina Windows e estou usando um Mac. Se eu clicar duas vezes no arquivo, recebo nomes de arquivo assim:

0001_rt_ñºéå-ïÅí ñºéå-àÍî _ÉAÅ[ÉãÉeÉBÅ[.dat

Por outro lado, se eu usar 'unzip' na linha de comando, o mesmo arquivo será exibido como

0001_rt_%FB+%C4%EE-%F2%FC%C6-%FB+%C4%EE-%EA%DB%F6-_%E2A%FC[%E2%EF%E2e%E2B%FC[.dat

O conteúdo dos arquivos é bom (eles não contêm nenhum caractere japonês, apenas números), mas eu preciso obter os nomes dos arquivos originais.

Existe alguma maneira de restaurar os nomes de arquivos corretos sem ter acesso aos arquivos originais, que estão em outro computador em outra cidade? Eu estou pronto para escrever um script Python rápido se for uma possibilidade, mas eu não sei muito sobre codificações de caracteres, então não tenho certeza de como fazer isso.

    
por Nathaniel 05.05.2014 / 12:23

1 resposta

4

O Unarchiver para o OS X é um aplicativo gratuito e de código aberto que pode lidar com isso, e solicitará a codificação do nome do arquivo quando ele não puder detectá-lo corretamente.

Isto irá sobrescrever o programa padrão para descompactar arquivos no OS X, mas eu acho que é muito mais poderoso do que o built-in.

    
por 05.05.2014 / 12:51