Eu tenho usado o comando wget
para criar arquivos estáticos de vários sites que não quero mais continuar atualizando.
Este comando funcionou bem para vários sites:
wget --recursive --no-clobber --page-requisites --html-extension \
--convert-links --restrict-file-names=windows -e robots=off \
--domains example.com --no-parent http://www.example.com
No entanto, estou tendo um problema com arquivos CSS em um site.
No site original, o CSS é carregado da seguinte forma:
<link rel='stylesheet' id='cptch_stylesheet-css' href='http://example.org/wp-content/plugins/captcha/css/style.css?ver=4.3.2' type='text/css' media='all' />
Mas no site arquivado isso é alterado para:
<link rel='stylesheet' id='cptch_stylesheet-css' href='wp-content/plugins/captcha/css/style.css@ver=4.3.2' type='text/css' media='all' />
Meu problema é que o? é alterado para um @ e o nome do arquivo é alterado para style.css@ver=4.3.2
. Isso funciona bem em um sistema de arquivos local, mas quando carregado em um servidor da Web, os arquivos CSS não são exibidos porque não têm a extensão .css.
Eu sei que eu poderia renomear os arquivos e editar os arquivos HTML (eu acho que poderia criar um script awk para que eu não precise editar mais de 100 arquivos manualmente). No entanto, eu gostaria de ficar com wget se eu puder.
Existe um parâmetro para o wget dar aos arquivos CSS a extensão .css, um pouco como o parâmetro --html-extension?
Tags wget