remova qualquer coisa entre o colchete angular, incluindo-o [duplicado]

0

Eu tenho um arquivo de texto muito grande ~ 105 G e inclui muito <XXXX> (colchetes angulares incluindo texto entre eles).

Desejo remover esses colchetes e texto entre eles.

    
por Sara Wasl 16.08.2018 / 12:09

2 respostas

1

"sed" é seu amigo. Estou supondo que não há suportes embutidos.

Cuidado! isso substituirá seu arquivo.

sed -i 's/<[^>]*>//g' big_file
    
por 16.08.2018 / 12:14
1

Dado um arquivo XML e a disponibilidade de XMLStarlet :

$ cat file.xml
<root>
<tag attrib="hello">Hello world</tag>
<tag attrib="nice">Nice to see you</tag>
</root>
$ xmlstarlet sel -t -v / file.xml

Hello world
Nice to see you

Isso usa XMLStarlet para extrair os valores do nó raiz e todos os seus nós filhos.

    
por 16.08.2018 / 12:52