Perguntas sobre 'pdf'

O Portable Document Format (PDF) é um padrão aberto para troca de documentos.
0
respostas

Situação OCR engraçada

Eu tenho um arquivo PDF de 300 dpi digitalizado com várias páginas em um sistema Ubuntu 16.04. Quando eu executo o seguinte comando: pdfocr -t -l swe -i *.pdf -o newfile.pdf Isso resulta em um arquivo de leitura de OCR. Cada palavra é...
30.06.2016 / 15:10
3
respostas

Como baixar páginas semelhantes?

Existe um site que contém um livro ou um artigo em pdf. por exemplo link e as outras páginas diferem apenas em "seq=".
01.09.2016 / 06:27
0
respostas

PDF: remove todas as caixas de texto que contêm um texto específico

Diga que a caixa de texto a seguir foi adicionada à parte inferior de todas as páginas de um documento PDF: This text has been added at time ‘t’ onde "t" é variável. Existe algum método para excluir todas as caixas de texto de uma só...
11.04.2016 / 08:23
0
respostas

Como compactar PDFs codificados por Tesseract enquanto mantém texto incorporado do OCR?

Eu tenho experimentado com o uso do Tesseract para OCR my PDFs, e tem sido bem-sucedido principalmente, particularmente com textos em alemão do Fraktur (o antigo estilo gothic print), que ferramentas como o Adobe Acrobat não reconhecem corretamen...
15.05.2016 / 23:52
0
respostas

Criando um arquivo PDF que evita salvar imagens de fundo

Eu gostaria de criar um arquivo PDF de forma que o espectador possa selecionar e copiar o texto, mas não as imagens nele contidas. Tenho visto exemplos disso em alguns documentos de faturamento, em que você não pode realmente selecionar e sal...
07.04.2016 / 07:24
0
respostas

PDF para conversão SVG com agrupamento e conversão de texto adequada

Estou procurando converter um arquivo pdf grande em svg (para criar uma animação web com java-script). Eu tentei vários métodos que estão disponíveis no meu sistema: Conversão com uma ferramenta chamada pdf2svg Conversão com pdftocairo...
08.01.2016 / 13:48
2
respostas

Como converter um DjVu para PDF mantendo a deduplicação de forma

Uma das (muitas) vantagens de compactar uma página digitalizada com o DjVu é a desduplicação de caracteres: …bitonal image compression that takes advantage of repetitions of nearly identical shapes on the page (such as characters) to effici...
17.12.2015 / 16:10
0
respostas

Convertendo vários arquivos .doc para .pdf pesquisável

Eu tenho um arquivo de comando em lotes que executa a conversão diária de arquivos de extração de dados para os formatos .txt, .doc e, em seguida, para os formatos .pdf. Eu executo uma série de macros de formatação no Word no arquivo .txt antes...
23.03.2016 / 21:15
0
respostas

Usando imagemagick para cortar e combinar PDFs em tamanho A4

Eu tenho que fazer uma fotocópia da minha carta de condução. Eu fiz a varredura da frente e do verso, e gerou um PDF para cada lado (e um PNG também apenas no caso). Até agora, tudo bem. Relatórios da Imagemagick: $ identify front.pdf back...
13.10.2015 / 12:54
0
respostas

Como imprimir somente páginas em PDF com texto pesquisado

Em um documento PDF com 200 > páginas, quero imprimir apenas as que contêm um determinado texto de pesquisa. No entanto, parece que o Acrobat Reader não é capaz de fazer isso. Eu posso imprimir apenas as páginas selecionadas, mas não posso se...
10.08.2015 / 11:18