Como encontrar arquivos com codificação de caracteres?

7

Estou usando o Windows XP. Eu estou procurando uma ferramenta que para determinado diretório irá encontrar todos os arquivos com codificação de caracteres particular (como UTF-8). Você conhece tal ferramenta?

    
por Hadi Di Wao 09.11.2010 / 15:19

3 respostas

4

Esta ferramenta funciona muito bem. Confira. Ele mostra todos os arquivos e suas codificações para uma pasta.

link

Há também isso, para arquivos em massa que mudam para UTF8.

link

    
por 25.06.2013 / 03:10
3

Em geral, isso não é possível - além do caso especial de arquivos de texto UTF-8 com uma marca de ordem de byte. Como o nome da codificação não é armazenado no arquivo de texto, a única maneira de informar, por exemplo, CP437 do CP850 seria fazer uma suposição com base em uma análise estatística de todo o arquivo, observando a frequência de determinados pares de caracteres, etc.

Os usuários do Solaris têm auto_ef mas, até onde eu sei, não há uma porta do Windows.

Os usuários do Perl têm Encode :: Guess

De acordo com Wikipedia "As novas versões do comando unix File tentam fazer uma detecção básica da codificação de caracteres. ( também disponível em cygwin e mac) "

Nenhuma das opções acima será 100% confiável. Se seus arquivos estiverem em uma das poucas codificações conhecidas, você poderá fazer melhor.

    
por 09.11.2010 / 20:11
1

No Windows, é possível pesquisar a Marca de pedido de byte (BOM) correta, com a condição de que os arquivos foram criados com uma lista de materiais.

Você precisaria de um programa de pesquisa para isso.
Uma possibilidade pode ser Grep para Windows e pesquisar usando o início do operador de arquivo (^^).

    
por 09.11.2010 / 16:00