Salvando páginas da web no Firefox como texto ou arquivos RTF que preservam a formatação e o posicionamento básicos

0

É possível, dentro do Firefox, salvar páginas contendo texto mantendo a formatação e posicionamento básico , mas não salvando nenhum código executável (JavaScript)?

Não precisa ser perfeito, apenas uma aproximação.

Eu preciso que o texto seja pesquisável, portanto, fazer uma captura de tela não será suficiente.

As respostas que se aplicam ao Windows são preferidas.

O que eu tentei:

  1. Copie e cole no bloco de notas.
    Resultado: Perdeu toda a formatação e posicionamento do texto (conforme esperado).
  2. Copie e cole no OpenOffice, no LibreOffice e no Wordpad.
    Resultado: Não manteve posicionamento de texto suficiente. Especificamente, textos justificados à esquerda e à direita foram todos justificados à esquerda.
  3. Salvar como arquivo de texto no Firefox.
    Resultado: O mesmo que o número 1.
  4. Salvar como arquivo somente HTML de dentro do Firefox.
    Resultado: Igual ao # 2.
  5. Salvar como arquivo HTML completo do Firefox.
    Resultado: Por qualquer motivo, o Firefox relata uma falha para muitas páginas, provavelmente devido ao modo como as páginas são exibidas via HTTPS.

Minha solução atual é uma PITA. Eu faço o download do HTML da página e de qualquer CSS. Em seguida, edito manualmente cada arquivo HTML para apontar para a cópia local dos arquivos CSS. Por fim, removo todas as referências JavaScript. Isso leva um bom tempo e esforço, e resulta em uma dependência de arquivos CSS, em vez de um único texto limpo ou arquivo RTF.

Eu considerei a extensão do formato de arquivo da Mozilla , mas acho que sempre salva tudo o JavaScript no arquivo. Eu prefiro um arquivo de texto simples ou RTF (rich text) sem dependências e definitivamente sem JavaScript.

    
por RockPaperLizard 10.06.2016 / 09:48

0 respostas