O Vim (a partir da versão 7.3) é muito limitado em relação ao suporte de caracteres não-ASCII em padrões. Em particular, \w
corresponde apenas a letras ASCII, que é de utilidade limitada.
Existem alguns padrões de classes de caracteres que suportam Unicode. De interesse para você é \I
, que geralmente combina letras e apenas letras, mais _
e @
. Pelo menos no Debian squeeze (em uma localidade UTF-8), existem erros; por exemplo, ×
e ÷
são correspondidos como letras, mas todas as letras acentuadas em latim parecem ser reconhecidas corretamente. \I
pode ser configurado através da opção isident
, pelo menos para a parte ASCII .
Se você quiser suporte sério a Unicode, precisará contar com uma ferramenta externa. Por exemplo, perl -C -e '/\p{L}/'
para corresponder às letras UTF-8 (assumindo uma localidade UTF-8).