Você pode usar egrep com opção -o (Mostra apenas a parte de uma linha correspondente que corresponde a PATTERN.) Por exemplo: echo page.html | egrep -o ". +" | sed s !!! | sed s !! > output.txt
Tenho o seguinte link:
Desejo salvar apenas algumas partes deste arquivo em um arquivo de texto, ou seja, quero apenas a parte da seqüência (com espaços nos locais corretos) e não o título ou qualquer número nessa página.
Em segundo lugar, podemos ver que há espaços após cada décimo caractere em todas as linhas. Eu gostaria de remover apenas os espaços que ocorrem após cada décimo caractere e salvar este conteúdo em outro arquivo de texto.
É possível? Alguém pode ajudar nesse sentido?
Você pode usar egrep com opção -o (Mostra apenas a parte de uma linha correspondente que corresponde a PATTERN.) Por exemplo: echo page.html | egrep -o ". +" | sed s !!! | sed s !! > output.txt