Remover o nó XML no Notepad ++

5

Eu tenho um grande XML com a estrutura abaixo. Agora, quero me livrar dos <tuv xml:lang="en-GB"><seg>CONTENT</seg></tuv> nós, então, para cada unidade, apenas a parte de DE permanece ( <tuv xml:lang="de-DE"><seg>CONTENT</seg></tuv> ). Existe uma maneira de fazer isso com o Notepad ++ ou uma ferramenta diferente? Eu não estou realmente em codificação, então quanto mais simples melhor.

O que eu tenho:

<tu tuid="ID_0">
<tuv xml:lang="en-GB">
<seg>Hello!</seg>
</tuv>
<tuv xml:lang="de-DE">
<seg>Hallo!</seg>
</tuv>
</tu>
<tu tuid="ID_1">
<tuv xml:lang="en-GB">
<seg>This is a test content! :)</seg>
</tuv>
<tuv xml:lang="de-DE">
<seg>Das ist ein Testinhalt! :)</seg>
</tuv>
</tu>
<tu tuid="ID_2">
<tuv xml:lang="en-GB">
<seg>All your base are belong tu us ...</seg>
</tuv>
<tuv xml:lang="de-DE">
<seg>Och nö, echt jetzt?</seg>
</tuv>
</tu>

O que eu quero:

<tu tuid="ID_0">
<tuv xml:lang="de-DE">
<seg>Hallo!</seg>
</tuv>
</tu>
<tu tuid="ID_1">
<tuv xml:lang="de-DE">
<seg>Das ist ein Testinhalt! :)</seg>
</tuv>
</tu>
<tu tuid="ID_2">
<tuv xml:lang="de-DE">
<seg>Och nö, echt jetzt?</seg>
</tuv>
</tu>
    
por Robert Herzog 22.08.2012 / 16:46

2 respostas

5

Ctrl + H (substituir ...)

Encontre o que: <tuv xml:lang="en-GB">.*?</tuv>

Modo de pesquisa: expressão regular

verificado:. corresponde à nova linha

    
por 22.08.2012 / 17:39
4

No NotePad ++, abra a caixa de diálogo Substituir e especifique:

Encontre o que: <tuv xml:lang="en-GB">.*?</tuv>

Substitua por:

Em seguida, defina o Modo de pesquisa para 'Expressão regular' e marque a opção '. corresponde à nova linha.

Substitua tudo agora deve remover todos os blocos en-GB. Nota: o truque aqui é com o? seguindo o *. Ele instrui o regex a ser não-ganancioso.

    
por 22.08.2012 / 17:34