Descompactar estes arquivos .gz dá resultados estranhos / inesperados, você pode fazê-lo funcionar?

5

Eu tenho uma coleção de arquivos de lista de discussão todos os gzip'd, eles estão em uma estrutura de diretório aninhada que começa com o que parece ser um nome pasta / jargão em branco.

Os arquivos estão aqui: link

Parece que está assim no cabeçalho de cada arquivo:

‹vÑKÿ/var/lib/mailman/archives/private/rabbitmq-discuss/

Eu tentei usar 7Zip , WinRAR e gzip no Windows 7 , por meio da linha de comando.

Também gzip no OS X , com os mesmos resultados, estou faltando algo óbvio? Não consegui reconstruir a estrutura de diretórios, o resultado parece ser uma mesclagem da estrutura de diretório e do arquivo.

Se você conseguir trabalhar, pode me informar:

  • Sistema operacional usado
  • Ferramenta de compactação / descompactação
  • Os argumentos da linha de comando ou o método de automação

Eu quero fazer isso de uma só vez, ou automatizado, sem precisar inserir cada arquivo por meio de um aplicativo gráfico.

    
por Nick Josevski 09.05.2011 / 06:57

1 resposta

6

O arquivo é compactado duas vezes. Experimente estes comandos no Mac OS X ou Linux:

wget http://lists.rabbitmq.com/pipermail/rabbitmq-discuss/2011-May.txt.gz
gzip -d 2011-May.txt.gz

Você deve acabar com o arquivo 2011-May.txt , que é texto simples. No meu sistema, wget está salvando adequadamente um arquivo individualmente gzipado que é descompactado para texto simples.

Se você já tiver o arquivo com gzip duplo, poderá executar este comando:

gzip -cd 2011-May.txt.gz | gzip -cd > 2011-May.txt

Isso irá descompactar o arquivo duas vezes e gravá-lo. Alternativamente, no Windows 7, você poderá usar o 7zip para descompactar o arquivo gzipado, abri-lo novamente com o 7zip e descompactá-lo novamente. Você deve ficar com o arquivo descompactado.

Se você tiver um grande número de arquivos como este em um diretório, poderá fazer algo assim:

for file in *.gz; do mv $file $file.gz; done;
gunzip *.gz
gunzip *.gz

Isso renomeará todos os arquivos que terminam em *.gz para *.gz.gz e, em seguida, executará gunzip sobre eles duas vezes.

    
por 09.05.2011 / 07:49