Salve o conteúdo da página da Web em um arquivo de texto

0

Tenho o seguinte link:

link

Desejo salvar apenas algumas partes deste arquivo em um arquivo de texto, ou seja, quero apenas a parte da seqüência (com espaços nos locais corretos) e não o título ou qualquer número nessa página.

Em segundo lugar, podemos ver que há espaços após cada décimo caractere em todas as linhas. Eu gostaria de remover apenas os espaços que ocorrem após cada décimo caractere e salvar este conteúdo em outro arquivo de texto.

É possível? Alguém pode ajudar nesse sentido?

    
por RSVP 09.06.2013 / 10:09

1 resposta

0

Você pode usar egrep com opção -o (Mostra apenas a parte de uma linha correspondente que corresponde a PATTERN.) Por exemplo: echo page.html | egrep -o ". +" | sed s !!! | sed s !! > output.txt

    
por C1sc0 09.06.2013 / 13:53