Mesclar vários arquivos HTML em ordem reversa?

1

Eu tenho vários arquivos HTML para este livro . Eu estou tentando adicioná-los na ordem oposta.

Eu tentei:

 cat *.html >> merge.html

Eu tentei usar tac na lista de arquivos baixados por tempo sem sucesso:

tac $(ls -t) >> output_file.html

Quando abro o arquivo, ele parece sempre piscar e as páginas estão faltando.

lcd047 recomendado abaixo que eu uso o htmldoc. Ao seguir a instalação , me deparo com o seguinte erro:

make: *** No rule to make target 'ENTER'.  Stop.

Quando tento executá-lo na linha de comando no download do documento em aqui , Eu me deparo com esse problema:

ERR011: Unable to parse HTML element on line 2011 of intro.html!
PAGES: 1 
BYTES: 39062
    
por NumenorForLife 01.06.2015 / 15:23

1 resposta

2

Quando você "cat" arquivos juntos, você vai acabar com a marcação extra que você não precisa. Notavelmente, você terá <html> e </html> tags, o que estragará sua renderização. Você também terá várias seções <head> . Essas páginas não parecem usar Javascript, mas eu não chequei de perto - colidir espaços de nomes Javascript também pode estragar você com essa abordagem.

Para um conjunto tão pequeno de páginas HTML, é melhor fazer isso manualmente ou criar um arquivo HTML (CHM) mesclado. No entanto, existem outras maneiras de fazer isso:

por 01.06.2015 / 15:38

Tags