Em vez de copiar seu texto de entrada para o Word, copie-o para o Notepad ++ ou qualquer outro editor com suporte completo ao RegEx.
Uma string RegEx para selecionar tudo o que estiver fora das tags ou tudo entre os sinais >
e <
.
(?<=>).*?(?=<)
(?<=>)
éumolhar para trás . Ele procura por >
sinais e age como uma âncora. Dessa forma, você pode excluir a string de pesquisa, o que é importante, pois você não deseja<Afghanistan
-
.*?
é um quantificador lento e seleciona tudo até a próxima expressão -
(?=<)
é um olha para frente e procura um sinal<
, mas exclui o próprio sinal pesquisado. Assim como o olhar por trás
Mas você não deseja selecionar os nomes dos países. Você deseja remover todas as tags. Você precisa do oposto da primeira expressão regular. Algo como
<.*?>
- Abra o Notepad ++ search & substituir diálogo
- Selecione Usar expressões regulares
- Encontre o que:
<.*?>
- Substituir por: nada