Processamento de texto: converte texto de tabela de conteúdo em formato de bookmark djvu?

3

Normalmente, na tabela de conteúdo de um livro, cada linha é para um capítulo ou seção e termina com seu número de página, por exemplo:

1 first chapter 10
1.1 first section 11
1.1.1 first subsection 12
1.2 second section 13
2 second chapter 14 
2.1 first section 16
2.2 second section 13

O formato dos marcadores nos arquivos djvu para o exemplo acima é:

(bookmarks
 ("1 first chapter" "#10" 
 ("1.1 first section" "#11" 
 ("1.1.1 first subsection" "#12" ))
 ("1.2 second section" "#13" ))
 ("2 second chapter" "#14" 
 ("2.1 first section" "#16" )
 ("2.2 second section" "#13" ))
)

em que os pontos principais são o pareamento entre parênteses esquerdo e direito para organização em árvore de seções e capítulos, aspas duplas para cada item de marcador e cada número de página precedido por um # . A separação entre linhas e recuo é apenas por conveniência para visualizar e editar manualmente o arquivo de texto do marcador, e não importa em nada.

Minhas perguntas são:

  1. Existem maneiras convenientes de converter um arquivo de texto simples de índice em formato de indicador de djvu, o que pode reduzir o manuseio manual o máximo possível? Isso pode ser obtido por aplicativos de processamento de texto ou programação sob alguma linguagem de programação ou uma combinação de ambos.

  2. Como sugerido em uma resposta relacionada por Dennis Williamson ,

    What you're doing is starting to look a little bit like XML. Perhaps you should use the real thing and use proper tools to manipulate it.

    a quick google turns up djvuxml. XML files can be easily manipulated using the appropriate Python or Perl module or shell utilities such as xmlstarlet.

    Gostaria de saber se o formato de bookmark do djvu é semelhante ao formato XML (admito que ainda não estou familiarizado com o XML, mas estou disposto a aprendê-lo se puder ajudar aqui)? As ferramentas XML podem ser usadas para converter um arquivo de texto de índice em formato de indicador de djvu?

por Tim 15.07.2011 / 03:40

0 respostas

Tags