Eu gostaria de converter um livro on-line ( arquivos html vinculados) em um arquivo pdf.
Eu experimentei o modo de dois passos no link
Primeiro, baixe os arquivos html por
wget -nd -mk http://www.unknownroad.com/rtfm/gdbtut/
Ma...
Eu tenho uma carga de arquivos nfo que eu quero fazer algumas substituições globais para alguns valores dentro de cada arquivo
por exemplo,
a.nfo has the value <set>Tonight's Menu ( June 2012 )</set>
b.nfo has th...
Eu preciso extrair texto com um script bash de um site em HTML, usei esta solução mas não funciona bem para mim, porque devo editar e formatar o texto de saída. Eu preciso do texto entre a tag:
<p><p tabindex="0">
Exemplo eu...
Estou extraindo certas informações de um site usando o comando curl . Eu preciso extrair uma certa subseção da string usando o comando grep. Por exemplo, usando o comando curl eu estou recebendo a página HTML e armazenando em uma variável como...
Eu estava tentando invocar um programa CGI através de um arquivo html.
Mas ficou preso pelo erro "arquivo não encontrado".
Estou tentando o mesmo programa que no site a seguir:
link
Por favor, encontre abaixo o arquivo html:
<ht...
Estou usando o SDcv , Collins Cobuild 5 é o dicionário, que gera html, como:
# czxyl @ archlinux in ~/Dropbox [12:57:27] C:16
$ sdcv hello
Found 7 items, similar to hello.
-->CMU American English spelling
-->hello...
Eu preciso inserir texto entre dois padrões definidos em um grande conjunto de arquivos.
Preciso alterar todas as linhas com este formulário:
<a href="/entry/someFile">
Para isso:
<a href="/entry/someFile.xhtml">
Eu te...
Enviei uma solicitação http para o "splunk.com" usando esse comando
curl -L splunk.com
Eu tenho códigos HTML. Eu quero encontrar subdomínios desse site, analisando os códigos html.
Eu gosto de usar curl e a linha de comando para processar páginas html.
URLs relativos são uma dor.
Existe algum utilitário fácil para tornar todos os URLs relativos absolutos?
Idealmente, isso seria parecido com
curlabsolute $URL...
sudo wget -O /home/KrypticRelic/Desktop/DefaultAccess.txt phenoelit.org/dpl/dpl.html
Isso imprime uma quantidade significativa de preenchimento para o texto real que eu gostaria.
Ex.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN...