Grep - Procurando por caracteres ascii não imprimíveis ou de maior alcance

1

Enfrentamos um problema quando alguém copiou uma string de algum lugar em um dos arquivos xml de metadados que continham caracteres ascii 239 (0xef), 191 (0xbf), 189 (0xbd)

Corrigimos o problema no arquivo conhecido, mas gostaria de verificar se existe problema semelhante em qualquer outro arquivo xml. O seguinte comando não encontrou nada

grep '[^[:print:]]' <filename>

O comando seguinte parece promissor, mas adiciona outros caracteres, como "<" e "/" etc.

grep -e "\W" <filename>

Como o arquivo xml e a string dada são texto de elemento, não posso usar a opção -v do grep.

grep $'\xef' <filename>

O comando acima marca o caractere, mas é específico demais para passar por 30.000 arquivos estranhos e encontrar o problema.

Existe alguma maneira de usar o comando grep para encontrar os caracteres problemáticos acima. Para a string problemática, a maioria das entradas são nomes de empresas e é muito improvável que tenham caracteres ascii estranhos.

    
por user871199 08.03.2017 / 01:46

0 respostas