Usando várias letras como um todo para delimar algum texto

0

Eu tenho um arquivo html, que contém um monte de / lt; | ^, alguns textos ao lado de cabeçalhos de lixo, palavras, etc. Eu quero extrair alguns textos entre um conjunto de letras, como "nbsp" e um pipe " | ". Eu perco informações se eu usar "delims = nbsp", já que os delims as consideram "n", "b", "s" e "p". Como devo abordar o problema e como extrair vários textos?

Exemplo de texto:

garbage nbsp; SOME_TEXT_1 | garbage
garbage nbsp; SOME_TEXT_2 | garbage
garbage nbsp; SOME_TEXT_3 | garbage
    
por Wajdet 09.09.2016 / 13:59

1 resposta

0

Se o texto for realmente tão simples quanto o seu exemplo, isso será feito;

for /f "delims=^|; tokens=2" %a in (garbage.txt) do echo %a

Se o texto ao redor contiver mais pontos-e-vírgulas, provavelmente será mais fácil obter uma versão do sed ou do awk no windows. Ou qualquer editor de texto decente, se for um trabalho de uma vez.

    
por 09.09.2016 / 14:14