Como “descompactar” um arquivo ZIM?

0

Eu tenho um arquivo ZIM e gostaria de ver seu conteúdo. Em particular, conte o número de artigos e imagens e, talvez, procure imagens.

Como fazer isso? De preferência no Linux, mas as instruções para outros sistemas também estão corretas.

Eu não quero contar imagens abrindo o ZIM no Kiwix e navegando em milhares de páginas e contando manualmente.

Não é incompressível por XZ nem por ZIP:

$ unxz wikivoyage_en_all_2015-09.zim
unxz: wikivoyage_en_all_2015-09.zim: File format not recognized

$ zipinfo wikivoyage_en_all_2015-09.zim
Archive:  wikivoyage_en_all_2015-09.zim
[wikivoyage_en_all_2015-09.zim]
  End-of-central-directory signature not found.  Either this file is not
  a zipfile, or it constitutes one disk of a multi-part archive.  In the
  latter case the central directory and zipfile comment will be found on
  the last disk(s) of this archive.
zipinfo:  cannot find zipfile directory in one of wikivoyage_en_all_2015-09.zim or
          wikivoyage_en_all_2015-09.zim.zip, and cannot find wikivoyage_en_all_2015-09.zim.ZIP, period.
    
por Nicolas Raoul 10.09.2015 / 04:48

1 resposta

1

A maneira mais fácil é usar o comando zimdump , parte de Zimlib .

Exemplo de saída:

zimdump -F wikivoyage_en_all_2015-09.zim
count-articles: 84897
uuid: 9213375a-53f4-819c-47ed-41fc87e7028f
article count: 84897
mime list pos: 80
url ptr pos: 193
title idx pos: 679369
cluster count: 40711
cluster ptr pos: 5169080
checksum pos: 468245393
checksum: 05b9bbf3b6d0c955b6ee74a3f929d911
main page: 44192
layout page: -

Não tenho certeza do que isso significa, mas pelo menos a contagem de artigos está disponível.

A opção -D despeja tudo em um diretório.

zimdump -D name_of_dir file.zim

    
por 16.09.2015 / 07:46

Tags