Eu uso o wget para baixar recursivamente sites (normalmente manuais html on-line), então uma vez eu tenho o html tudo em uma pasta eu converto para o formato de minha escolha usando Calibre .
Como um (download e) converterá estruturas HTML em EPUB (ou qualquer outro formato adequado para o leitor Sony PRS-505)?
Minha pergunta não é como converter um único arquivo HTML em um arquivo EPUB, pois isso é fácil; o que eu quero dizer é que tenho alguns livros que quero ler no meu Sony PRS-505 e estes livros estão mais frequentemente online em formato HTML mas com muitas páginas interligadas e há uma página com a lista de conteúdos, como este exemplo link
... ou às vezes é um pouco mais complicado, pois a lista de conteúdos lista apenas os capítulos, e dentro dos capítulos há links para sub-capítulos, como neste exemplo: http: SLASHSLASHwww.hyw.com/Books/WargamesHandbook/Contents.htm (Eu só posso postar um hiperlink agora b / c de restrição de usuário, então é por isso que há SLASHSLASH em vez de //)
Eu quero converter esses exemplos e vários outros, com capítulos corretos, imagens e alguma formatação aceitável, etc, então basicamente eu quero fazer um ebook adequado fora da árvore HTML.
Qual é a maneira mais fácil?
Eu uso o wget para baixar recursivamente sites (normalmente manuais html on-line), então uma vez eu tenho o html tudo em uma pasta eu converto para o formato de minha escolha usando Calibre .