Perguntas sobre 'html'

HyperText Markup Language (HTML)
0
respostas

extrair texto do HTML

Eu tenho esta página . Desejo extrair texto da página html, particularmente cabeçalho da tabela ( th ) e dados da tabela ( td ). Por exemplo: País: Estados Unidos (EUA) , Estado: Califórnia onde th = País e td = Estados Unidos (...
24.10.2015 / 07:32
1
resposta

Extração de texto da página HTML

Estou usando o comando xidel para extrair texto da página HTML. Aqui está o meu código xidel http://www.ip-adress.com/ip_tracer/8.8.8.8 --extract "<table> <tbody> <tr> <td> <table> <tbody> <tr...
25.10.2015 / 05:32
2
respostas

Ubuntu SELinux - por que diferentes tipos de arquivos var_t vs file_t

Eu tenho o Ubuntu 14.04 rodando em dois vm's. Eu tenho o SELinux permissivo habilitado em ambos. No system1, todos os meus arquivos + diretórios vinculados em /var/www/html estão marcados como var_t e o diretório vinculado simbólico (para...
06.07.2015 / 20:21
0
respostas

O htmldoc pode criar marcadores de PDF de vários níveis?

Eu baixei um livro de html on-line ( link ), pelo seguinte comando wget -r -np -nH --cut-dirs=3 -p -k http://www.cim.mcgill.ca/~franco/OpSys-304-427/lecture-notes/lecture-notes.html Depois tentei convertê-lo para pdf usando o htmldoc. M...
03.09.2014 / 03:13
1
resposta

Extrair valores do HTML via analisador HTML [duplicado]

Inicialmente perguntei sobre uma maneira de usar grep / awk diretamente de um arquivo HTML. Recebi alguns comentários, mas vejo que as pessoas não tinham todo o HTML e, portanto, as soluções sugeridas falharam. Alguns mencionaram que...
23.06.2014 / 13:08
2
respostas

Como posso grep para tags HTML quebradas?

Eu quero passar por todos os meus arquivos HTML e ver se tenho alguma tag errada, exemplo <br> , <hr> e assim por diante, eu quero ver quais tags não estão fechadas no arquivo HTML. for htmlFile in 'ls -f *.html ' ; do...
11.06.2014 / 15:10
3
respostas

Como posso excluir tags html de um arquivo usando sed?

Eu tenho um arquivo que é misturado com o texto normal que eu preciso e as tags html. Eu sei que com o REGEX é possível reconhecer tags html e com o sed um pode trocar por uma string vazia, mas eu não sei como aplicá-lo concretamente.     
16.02.2015 / 13:56
5
respostas

Renomeie um arquivo HTML com base no conteúdo de uma tag

Eu tenho muitos arquivos html que eu quero renomear de acordo com o conteúdo de a tag h1. Alguma sugestão sobre como fazer isso no bash? Exemplo de um arquivo: <!DOCTYPE html><html lang="pt-BR"><head><meta charset="...
17.02.2018 / 18:19
1
resposta

Localizando todos os tipos de extensões referenciados em um arquivo html

Aqui está minha declaração de problema: Existe uma pasta com muitos arquivos html e texto. Eu preciso recursivamente passar por cada um deles e encontrar todos os tipos de extensões de arquivos referenciados nesses arquivos html / text como ....
12.02.2014 / 01:29
2
respostas

Como especificar o tipo de arquivo em um hard link [closed]

Alguém sabe como especificar o tipo de arquivo de um link físico? Isso é possível? Por exemplo, desejo vincular a um arquivo HTML (com o tipo de conteúdo text/html ) no diretório do meu site, por isso usei ln path/to/html/file.html path/to...
25.02.2015 / 08:18