O comando grep
fornecido procura a string <span [...]</span>
em qualquer arquivo, que está no diretório articles
. Os seguintes comandos sed
estão substituindo várias strings.
Por exemplo, sed s@articles/@@
(com apenas uma barra / ) pode ser lido como: sed search@this_string@replace_with_this@
; a string articles/
será substituída por nada. Em vez de canalizar de um sed
para o próximo, você pode combinar todos os scripts para um com o mesmo resultado.
Se você não quiser usar nenhum outro comando para extrair as coordenadas, poderá usar:
grep '<abbr class="latitude">[-0-9.]*</abbr><abbr class="longitude">[-0-9.]*</abbr>' -R articles --only-matching | sed 's@articles/@@;s@:<abbr class="latitude">@ @;s@<abbr class="longitude">@ @;s@</abbr>@@g' | sort -u -b -k1 >geocodes_from_html.txt