Perguntas sobre 'parsing'

1
resposta

Como faço para rapidamente analisar arquivos ASCII grandes para registros correspondentes?

Eu tenho muitos arquivos contendo registros de dados, armazenados como arquivos ASCII delimitados por espaço. Cada registro é uma linha contendo dados numéricos, com algumas colunas inteiras e outras com ponto flutuante, por exemplo. 1 1 571...
21.10.2013 / 15:16
0
respostas

Uma palavra-chave pode estar em um array PDF Annots?

O analisador JHOVE para PDF, que eu mantenho, algumas vezes encontrará um objeto não-dicionário na matriz Annots do PDF. De acordo com a seção 8.4.1 da especificação PDF, a matriz Annots contém "uma matriz de dicionários de anotação". No cas...
29.04.2013 / 16:13
0
respostas

Como exportar o DokuWiki sem login de máquina

Eu preciso de um plugin para exportar todo o DokuWiki, PDF preffered. Eu tentei bookcreator, dw2pdf e um plugin epub que não se encaixam em meus requisitos. Seria bom se os links internos fossem substituídos por links para documentos clicáveis ....
20.07.2012 / 13:51
1
resposta

Tentando usar XML :: Parser e XML :: XPath, onde eu digito o comando?

Aqui está o tutorial que estou usando, que me foi assegurado como de alta qualidade pelo Google: link Agora, o que estou tentando fazer é executar alguns scripts de teste em alguns arquivos XML, transferindo os dados para as minhas tabelas...
19.07.2011 / 12:26
3
respostas

Extraia várias seções de páginas de um pdf

Eu tenho uma tonelada de arquivos pdf (exames anteriores), dos quais apenas duas seções de páginas (cerca de 8 páginas cada) são relevantes para mim. Gostaria de extrair as duas seções em um arquivo separado para cada uma delas. Eu usei o Ado...
12.10.2015 / 09:20
0
respostas

Recuperando uma variável de registro em um script em lote

Eu gostaria de escrever um script em lote (Windows XP) que extraia certos caminhos de instalação do registro. Como alguém poderia escrever um roteiro? Eu escrevi o seguinte - eu sou (como você pode ver no meu exemplo abaixo) um programador...
08.07.2010 / 12:42
1
resposta

Obtém valores de variáveis do arquivo de configuração

Eu tenho um arquivo de configuração com algumas variáveis, por exemplo, abaixo, mas meu comando só lê algum valor variável, não consigo ler todos os valores no arquivo de configuração. Parece apenas ler valores com números. qual é a melhor manei...
02.08.2014 / 02:58
1
resposta

Parsing out URLs específicos do arquivo html local

Eu quero analisar algumas URLs de um arquivo html salvo com um script / comando bash simples, para que eu possa baixá-las via wget laters. O que eu tenho até agora é: awk 'BEGIN{ RS="<a *href *= *\""} NR>2 {sub(/".*/,"");print; }'...
17.04.2012 / 15:01
1
resposta

Eu instalei e executei o Heritrix Web Crawler. Ele armazenou dados em arquivos .arc.gz

Se você usou o Heritrix Web Crawler, agradecemos sua ajuda. 3 perguntas: Um arquivo de arco provavelmente contém códigos-fonte de MUITAS páginas nele. Como faço para descobrir qual é qual? Como interpreto os arquivos .arc.gz? Eu os abri...
15.10.2009 / 00:31
3
respostas

Analisa uma string complexa em células separadas

Eu preciso analisar uma string com tamanhos de campo variados em colunas separadas. Eu tenho a seguinte série de dados. Usando fórmulas Gostaria de preencher as colunas F, G, H e I nas várias seções de campo da coluna D. Eu criei o cont...
02.09.2016 / 15:19