Estou tentando ajudar um colega em um MacBook Air MacOsx 10.11.06 com o arquivamento de um site usando o wget (versão 1.19.1) instalado através do brew. Usando este comando.
wget --recursive --no-clobber --page-requisites --html-extension --convert-links --restrict-file-names=windows --domain scart.be --warc-file=20161103_scart www.scart.be
No entanto, isso resulta em um erro no terminal:
Converting links in http://www.scart.be/index.html?q=fr%2Fnode%2F1135.html 35-27 Incomplete or invalid multibyte sequence encountered
Eu testei e funciona bem em uma máquina xenial Ubuntu (versão wget 1.17.1) e em outro sistema, MacOsx 10.11.06. (versão do wget 1.19.1)
Eu tentei mudar o "--restrict-file-names = windows" para "--restrict-file-names = nocontrol", nada mudou. Se tentarmos importar o arquivo .warc para o Webrecorder-player, ele exibirá "nenhum indicador encontrado" onde ele trabalha com arquivos .warc criados em duas outras máquinas mencionadas anteriormente. O que eu encontrei até agora em outros sites, é que esse erro está relacionado à codificação de caracteres e foi preso lá.