Estou gerando um conjunto de arquivos ' xml
' de um arquivo ' csv
'. Alguns dos campos no arquivo csv contêm ' &
' e outros caracteres xml inválidos que precisam ser substituídos por suas contrapartes xml apropriadas (por exemplo, ' &
' no caso de ' &
')
Existe alguma ferramenta com a qual eu possa corrigir diretamente esses arquivos xml?
Você pode usar perl
:
echo "a&a" | perl -MHTML::Entities -e 'while (<>) {print encode_entities($_, "&");}'
Dá:
a&a
Como segundo parâmetro, você pode especificar caracteres especiais que deseja codificar.