Como procurar por arquivos que não contenham um elemento raiz XML apropriado?

2

Eu preciso pesquisar vários milhares de arquivos XHTML e XML e ver uma lista de arquivos que não contêm a seguinte string na primeira linha:

<?xml version="1.0" encoding="utf-8"?>

Como eu faria isso? Eu pensei que poderia fazer isso no Notepad ++ usando a função Search in Files, mas não vejo nenhuma maneira de procurar por uma string que não seja encontrada e / ou formatada corretamente e tenha uma lista de arquivos.

    
por Richie086 11.10.2012 / 00:36

2 respostas

1

Use Agent Ransack e configure-o para pesquisar somente pelos tipos de arquivo .xml. Se você sabe que o RegEx usa isso, estou no trabalho ou ajudaria com isso. Eu acredito que o Agent Ransack vem com a capacidade de usar apenas uma pesquisa negativa, mas eu vou ter que verificar.

O Agent Ransack tem um "Especifica não expressão", que funcionará para o que você quer, mas você precisará de uma seqüência de correspondência de expressão regular para poder retirá-la. Se você é um desenvolvedor, é uma boa habilidade, pelo menos, ser pseudo-familiar com o suficiente para fazer algumas pesquisas básicas ou correspondência de texto com.

[Editar] O Agent Ransack não possui uma capacidade de pesquisa "Não Expressão". O RegEx foi bastante simples embora

(<\?xml version="1.0" encoding="utf-8"\?>)

Vou continuar procurando um aplicativo de ferramenta / utilitário.

    
por 11.10.2012 / 00:41
5

Eu sei que esta é uma pergunta antiga, mas eu vim aqui procurando as mesmas informações e pensei em compartilhar uma solução mais simples usando o Agent Ransack, que na verdade permite que você especifique uma condição NOT. Para a pergunta acima, usando o seguinte como o texto para procurar funciona perfeitamente, e a única modificação necessária na string em questão é escapar das aspas duplas:

NOT "<?xml version=\"1.0\" encoding=\"utf-8\"?>"

Espero que isso ajude alguém.

    
por 02.12.2014 / 18:13