wget envia aspas de 3 bytes

0

Eu corri um wget -b . A partir do log, eu estava tentando obter a lista de arquivos baixados com sucesso, e para isso eu fiz um grep saved wget-log | awk -F '"' '{print $2}' mas não funcionou. Outras investigações levaram-me a notar que o nome do ficheiro está entre aspas duplas esquerda e direita de 3 bytes (0xE2 0x80 0x9D), em vez das aspas duplas normais (0x22).

O comportamento normal deste wget, ou é alguma variável de ambiente no meu final, algo assim? Posso fazer com que o wget use aspas normais ou use apenas bytes ASCII padrão em seu registro, de alguma forma? Eu conheço outras maneiras de contornar isso, substituindo os bytes por sed por exemplo. Estou muito intrigado com isso: passei vários minutos no google procurando por qualquer comentário sobre isso e não consegui encontrar nada, é como se ninguém tivesse notado isso antes.

    
por msb 06.04.2017 / 20:05

1 resposta

1

Parece ser por design em localidades Unicode. Há um comentário sobre isso na lista de discussão do wget . Os arquivos de tradução de idiomas também contêm traduções para citações, de modo que você recebe as cotações "adequadas" de acordo com o idioma usado.

Você pode fazer com que use aspas normais usando uma localidade não-Unicode.

LC_ALL=C wget ...

ou

LC_CTYPE=C wget ...
    
por 06.04.2017 / 20:58

Tags