Se não for um documento complexo, você pode abrir em um navegador somente texto, como lynx
e apenas salvar o texto
Tenho certeza que você pode fazer isso com as opções de linha de comando
Então deixe-me começar do começo do que estou tentando fazer.
Eu uso o WP Engine e estou tentando fazer o download de uma cópia dos relatórios mensais que eles fornecem no painel.
O problema é que tenho 15 instalações, cada uma com muito tráfego, e os relatórios mensais incluem estatísticas de todos os seus sites, divididos diariamente. Então, a página é enorme, quase um milhão de linhas.
Estou tentando descobrir a melhor maneira de salvar esta página como PDF. Quando eu vou para Imprimir a página e selecione "Salvar como PDF", basicamente, expira porque a página é muito grande.
Quais são minhas opções aqui? Existe alguma maneira de remover todas as informações desnecessárias (como CSS) para tentar reduzir a página antes de salvar em um PDF? Posso destacar uma determinada parte da página e exportar essa seleção como um PDF?
Estou procurando uma maneira engenhosa de exportar alguns desses dados para um PDF.
Se não for um documento complexo, você pode abrir em um navegador somente texto, como lynx
e apenas salvar o texto
Tenho certeza que você pode fazer isso com as opções de linha de comando
Fluxo de trabalho alternativo.
obtenha o html com wget
ou curl
.
abra o arquivo html com LibreOffice
salvar como PDF
ideia roubada de aqui
Se funciona, provavelmente depende de quanto js e css estão nele.