"sed" é seu amigo. Estou supondo que não há suportes embutidos.
Cuidado! isso substituirá seu arquivo.
sed -i 's/<[^>]*>//g' big_file
Eu tenho um arquivo de texto muito grande ~ 105 G
e inclui muito <XXXX>
(colchetes angulares incluindo texto entre eles).
Desejo remover esses colchetes e texto entre eles.
"sed" é seu amigo. Estou supondo que não há suportes embutidos.
Cuidado! isso substituirá seu arquivo.
sed -i 's/<[^>]*>//g' big_file
Dado um arquivo XML e a disponibilidade de XMLStarlet :
$ cat file.xml
<root>
<tag attrib="hello">Hello world</tag>
<tag attrib="nice">Nice to see you</tag>
</root>
$ xmlstarlet sel -t -v / file.xml
Hello world
Nice to see you
Isso usa XMLStarlet para extrair os valores do nó raiz e todos os seus nós filhos.
Tags text-processing sed xml