Como encontrar caracteres especiais no Linux Vim

0

Eu quero encontrar caracteres especiais em um arquivo de texto. Sabe-se que o arquivo codificado em UTF-8 contém

Chinese characters , 
"-", 
"^A"(control-A, which is one of special characters), 
numbers, 
alphabets, and 
some other characters. <- This is what I want to find out.

Estou usando o Vim no Linux para encontrar outros caracteres especiais.

eu usei

/[^^A0-9a-zA-Z-] 

para descobrir isso, mas isso também mostrará os caracteres chineses. Como filtrar caracteres chineses e mostrar apenas os outros caracteres especiais no arquivo?

    
por Marcus Thornton 22.01.2014 / 05:15

1 resposta

0

O intervalo do código de código Unicode para IDEOGRAFIAS UNIFICADAS DE CJK é 0x4E00-0x9FFF ; você teria que excluir esse intervalo de caracteres da sua coleção [...] (provavelmente usando o átomo de expressão regular \%uNNNN ).

Infelizmente, Vim atualmente não é possível pesquisar por intervalos maiores que 256 caracteres , então você teria que combinar várias coleções ( [...]\|[...]\|[...]\|... ) ou escolher uma abordagem diferente.

    
por 22.01.2014 / 12:27