Existe uma ferramenta para remover todos os hiperlinks de um arquivo html?

4

Existe uma maneira de fazer isso no Ubuntu? Eu li que é possível em php, mas eu não estou familiarizado com o PHP em tudo.

    
por 22lk94k943 only 29.05.2013 / 16:33

2 respostas

3

Você pode usar sed para isso, mas só funcionará para links que estão em uma única linha no código html.

Atualização:

Maldito regex ganancioso! ;) Este deve funcionar agora!

sed -i 's|<a[^>]\+>|<a>|g' <the-html-file>

    
por ortang 29.05.2013 / 16:49
1

Depende do que você está tentando fazer:

Se você tiver uma pilha de arquivos em sua máquina e quiser remover os links, use algo como um pequeno script em Perl para remover as tags <a ...> ... </a> . Você pode remover outras tags (ou até mesmo todas as tags) de maneira semelhante. Com as opções de correspondência de padrão corretas, essa abordagem pode manipular tags divididas em várias linhas. (É muito elegante, mas os detalhes não caberão na margem deste post).

Se você estiver tentando procurar arquivos em algum servidor da web, usando o firefox (ou outro navegador), algum tipo de script greasemonkey que modifique páginas automaticamente, antes de mostrá-las, pode ser o que você deseja.

    
por notmyopinion 29.05.2013 / 16:50

Tags