Você deve editar seu arquivo .htaccess para desativar o mecanismo de reescrita durante o espelhamento. Você terá arquivos com nomes estranhos, mas não deverá ter nenhum conflito na nomenclatura.
Estou tentando espelhar um site WordPress que não é mais atualizado para que eu possa remover o back-end do php. Não tenho vontade de me preocupar com a atualização do site novamente. Eu percebo que isso quebrará partes dinâmicas, como pesquisa e comentários, e estou de acordo com essa perda de funcionalidade. Se houver uma maneira melhor de fazer isso, estou aberto a outras sugestões além do wget.
No momento, estou usando o seguinte comando.
wget -vN --server-response --wait=6 --domains=example.com --exclude-directories=admin --mirror --random-wait=on http://example.com -o ~/exampleFetch.log
O problema é que algumas páginas não estão sendo salvas e o wget está gerando o seguinte erro.
Cannot write to "example.com/archives/2009/09/16/example-post-title" (Not a directory).
Isso ocorre porque há links para os meses arquivados na página principal que listam todas as postagens de um determinado mês. Por exemplo:
example.com/archives/2009/09
é salvo como um arquivo localmente por wget, porque
http://example.com/archives/2009/09/
retorna uma página sensata.
Espero que eu esteja perdendo um interruptor ou tenha entendido mal um. Obrigado pelo seu tempo.
Acho que se você usar a opção --html-extension, ele criará páginas (com uma extensão .html!) para cada uma dessas páginas nomeadas da pasta.
Eu segui estas instruções para espelhar meu blog wordpress e eles funcionaram bem.