Localiza arquivos com caracteres não-ASCII em nomes de arquivos no Windows XP

7

Existe alguma maneira fácil de encontrar todos os arquivos em um determinado diretório que possuam caracteres não-ASCII (isto é, Unicode) no nome do arquivo? Estou executando o Windows XP x64 SP2, sistema de arquivos NTFS.

    
por EMP 25.01.2011 / 11:14

2 respostas

11

Aqui está um método usando o Powershell:

gci -recurse . | where {$_.Name -match "[^\u0000-\u007F]"}
    
por 17.04.2011 / 21:53
5

Acabei de escrever um script Python para isso. Postar no caso de ajudar alguém. Sinta-se à vontade para ir ao StackOverflow.

import sys, os


def main(argv):
    if len(argv) != 2:
        raise Exception('Syntax: FindUnicodeFiles.py <directory>')

    startdir = argv[1]
    if not os.path.isdir(startdir):
        raise Exception('"%s" is not a directory' % startdir)

    for r in recurse_breadth_first(startdir, is_unicode_filename):
        print(r)


def recurse_breadth_first(dirpath, test_func):
    namesandpaths = [(f, os.path.join(dirpath, f)) for f in os.listdir(dirpath)]

    for (name, path) in namesandpaths:
        if test_func(name):
            yield path

    for (_, path) in namesandpaths:
        if os.path.isdir(path):
            for r in recurse_breadth_first(path, test_func):
                yield r


def is_unicode_filename(filename):
    return any(ord(c) >= 0x7F for c in filename)


if __name__ == '__main__':
    main(sys.argv)
    
por 25.01.2011 / 12:52