Possível extrair o título e o pagenum de cada página em um arquivo djvu

1

Esta é uma versão djvu de as perguntas que fiz antes para arquivos pdf . Eu tentei uma ideia semelhante como fred deu a pergunta anterior . Mas agora estou preso em como obter o número de páginas de um arquivo djvu, porque não sei qual comando pode ser usado para essa finalidade.

Por fim, refiro agora a questão aqui:

Eu queria saber se existem algumas maneiras de extrair o título e pagenum de cada página em um arquivo djvu? Ou por alguns aplicativos, ou por programação em alguma linguagem de programação com algumas bibliotecas djvu?

O título de cada página deve ser a primeira linha da página, por exemplo, em slides / arquivos de apresentação.

A saída deve ser um arquivo de texto, com o seguinte formato:

title_of_first_page pagenum_of_first_page
title_of_second_page pagenum_of_second_page
...

Obrigado e cumprimentos!

    
por Tim 13.09.2011 / 02:07

1 resposta

1

Semelhante ao .pdf exemplo , o script a seguir imprimirá a primeira linha de texto encontrada em uma determinada página (via head -n 1 ).  Você pode ver os comandos disponíveis digitando djvused --help no terminal.

djvused está no pacote djvulibre-bin

if="$HOME/Downloads/The Geometry of Exponential Families.djvu"
pages=$(djvused -e 'n' "$if")
for ((i=1; i<=$pages; i++)) ;do
    printf "%s %d\n" "$(djvused -e 'select '$i'; print-pure-txt' "$if" | head -n 1)" $i
done
    
por 13.09.2011 / 05:21