Encontre caracteres UTF8 com RegEx

2

Eu tenho muitos arquivos (xml, css, js, html)

e gostaria de ver todos que têm caracteres "UTF-8", porque alguns arquivos estão em ANSI e outros em UTF-8 without BOM .

Eu tentei vários "RegEx" para a consulta, por exemplo:

[^\x00-\x7F] ou \X ou \p{L}

  • Em Sublime-Text eu usei Ctrl + Deslocamento + F com RegEx

  • No Notepad ++, usei "Localizar todos em todos os documentos abertos" com RegEx

Mas ambos retornaram os documentos em "UTF-8" e "ANSI".

É possível encontrar apenas documentos com caracteres UTF-8 ou apenas como "iso-8859-1"?

    
por Guilherme Nascimento 07.01.2015 / 18:07

1 resposta

1

It is possible to find only documents that have UTF-8 characters or only like "iso-8859-1"?

Não, isso não é possível em UTF-8 sem BOM. A única diferença é como interpretar os personagens e NÃO os próprios personagens.

    
por 07.01.2015 / 19:18