Como você pode renomear centenas de arquivos PDF com informações encontradas no arquivo?

3

Eu digitalizo formulários no trabalho em arquivos PDF e, em seguida, uso o Nitro para torná-los pesquisáveis.

Eu preciso encontrar uma maneira de ler os primeiros 50 caracteres do arquivo, que está sempre no mesmo lugar no documento, apenas texto diferente, e renomeie o arquivo com as informações encontradas nesses caracteres.
Então eu preciso salvá-lo no diretório em nosso servidor.

Estou procurando há algum tempo e não encontrei nada que atenda a essa necessidade.
Você conhece algum código ou programa que execute essa função?

    
por user99856 01.10.2011 / 05:24

1 resposta

2

Existem muitas maneiras de fazer isso com um script, mas o Python é uma linguagem versátil e funciona em praticamente todas as plataformas.

Este é um bom manual para .

E esta é uma biblioteca que você pode usar para ler arquivos em pdf . Existem algumas bibliotecas em PDF, no entanto.

Você pode até mesmo fazer isso sem uma biblioteca de PDF, lendo o arquivo diretamente.

Se você não estiver familiarizado recentemente com a redação de scripts, você chegará mais rápido com alguma ajuda, mas se quiser experimentar, as principais áreas em que deseja focar são:

  1. Lendo argumentos da linha de comando (assim você pode passar o nome do arquivo quer mudar)

  2. Abrindo, lendo e fechando arquivos

  3. Abrindo, lendo e fechando arquivos com a biblioteca PDF

  4. Manipulação de strings - substrings e strings de divisão podem ser necessários

  5. Usando as chamadas do sistema para renomear um arquivo

por 02.10.2011 / 04:06