Unix unzip está falhando, mas o Mac Archive Utility funciona

2

Eu tenho um monte de arquivos com uma extensão .zip que não consigo extrair no meu HPC:

$ unzip RowlandMetaG_part1.zip
Archive:  RowlandMetaG_part1.zip
warning [RowlandMetaG_part1.zip]:  13082642473 extra bytes at beginning or within zipfile
  (attempting to process anyway)
error [RowlandMetaG_part1.zip]:  start of central directory not found;
  zipfile corrupt.
  (please check that you have transferred or created the zipfile in the
  appropriate BINARY mode and that you have compiled UnZip properly)

O tamanho do arquivo zip em si é 17377631766 bytes.

No entanto, quando eu baixo o arquivo para o meu mac e clico duas vezes, o aplicativo Archive Utility pode descompactar o arquivo (ele contém um diretório com cerca de 200 arquivos gzipados dentro).

O lugar que gerou o arquivo diz:

The files are simply zipped here on our local lab PC running Windows, then uploaded to Dropbox...most people don’t have any problems with them and many can directly download the links I give them using the Linux wget command directly into their servers, then unzip there (the Linux utility can usually handle PC-zipped files).

Não tenho certeza se o fato de os arquivos serem de dropbox é relevante, mas usei curl -LO para fazer o download (também tentei wget - isso não muda nada), e os arquivos aparecem com ?dl=1 no final do nome do arquivo. Dito isso, quando eu baixo do dropbox para o meu mac, unzip ainda falha com o mesmo erro.

Minha pergunta - existe alguma maneira de conseguir isso para descompactar o servidor? Algum software que realizará a mesma coisa que Archive Utility.app faz, ou alguma outra maneira de determinar qual protocolo de descompactação usar?

EDIT: Baseado em comentários: algumas informações adicionais:

$ file RowlandMetaG_part1.zip
RowlandMetaG_part3.zip: Zip archive data, at least v2.0 to extract
$ zip --version
Copyright (c) 1990-2008 Info-ZIP - Type 'zip "-L"' for software license.
This is Zip 3.0 (July 5th 2008), by Info-ZIP.

Além disso, tentei tar , mas sem sucesso.

$ tar -xvf RowlandMetaG_part1.zip
tar: This does not look like a tar archive
tar: Skipping to next header
tar: Archive contains 'l@2\t1\fjp4uP0' where numeric off_t value expected
tar: Archive contains '412b44
$ ls
???MK??%b???mv?}??????@*??TZ?S?? ??????+??}n>,!???ӟw~?i?(??5?#?ʳ??z0?[?Ed?@?쑱??lT?d???A??T???H??
,??Y??:???'w,??+?ԌU??Wwxm???e~??ZJ]y??ˤ??4?SX?=y$Ʌ{N\?P}x~~?T?3????y?????'
61' where numeric mode_t value expected tar: Archive contains '2
$ unzip RowlandMetaG_part1.zip
Archive:  RowlandMetaG_part1.zip
warning [RowlandMetaG_part1.zip]:  13082642473 extra bytes at beginning or within zipfile
  (attempting to process anyway)
error [RowlandMetaG_part1.zip]:  start of central directory not found;
  zipfile corrupt.
  (please check that you have transferred or created the zipfile in the
  appropriate BINARY mode and that you have compiled UnZip properly)
5hЈ38vÃ2p' where numeric time_t value expected # etc...

E acabo com uma porcaria no diretório como este:

$ file RowlandMetaG_part1.zip
RowlandMetaG_part3.zip: Zip archive data, at least v2.0 to extract
$ zip --version
Copyright (c) 1990-2008 Info-ZIP - Type 'zip "-L"' for software license.
This is Zip 3.0 (July 5th 2008), by Info-ZIP.
    
por kevbonham 17.04.2018 / 20:26

3 respostas

3

Há uma chance de que, embora o arquivo termine com ".zip", não é um arquivo zip.

Você pode confirmar se este é um arquivo zip (e ao mesmo tempo determinar qual é o formato real do arquivo) usando o utilitário file :

file RowlandMetaG_part1.zip

Quando o formato do arquivo for determinado, você poderá usar a ferramenta adequada para desarquivá-lo.

    
por 17.04.2018 / 21:40
3

Acontece que, como o arquivo é muito grande, zip não consegue lidar com isso (ele atinge o máximo de 2 Gb). Em vez disso, posso usar jar :

$ jar xvf RowlandMetaG_part1.zip
inflated: RowlandMetaG_part1/296E-7-26-17-O_S23_L001_R1_001.fastq.gz
# etc...
    
por 19.04.2018 / 17:42
0

Tente extraí-lo com o utilitário tar talvez

tar xvf <file-name>

Talvez esse link seja relevante:

link

    
por 17.04.2018 / 21:33