Contanto que suas tags HTML fiquem limitadas a uma única linha, as seguintes informações funcionarão:
sed 's/<[^>]*>//g'
Eu tenho um arquivo que é misturado com o texto normal que eu preciso e as tags html. Eu sei que com o REGEX é possível reconhecer tags html e com o sed um pode trocar por uma string vazia, mas eu não sei como aplicá-lo concretamente.
Se você não está insistindo em sed
, a melhor coisa a fazer seria lynx
.
lynx --dump <filename>.html
Isso gerará o conteúdo do arquivo html no formato que o código html pretendia exibir. A única condição é que o nome do arquivo tenha uma extensão .html
ou .htm
.
Tags sed html regular-expression