Como escanear várias páginas de um livro no Linux?

0

Eu quero que o processo se pareça com:

  1. escolho as configurações de digitalização corretas (dpi, profundidade de cor etc.)
  2. Eu coloco a primeira página no scanner e inicio o processo
  3. O scanner varre a página e espera que eu posicione a próxima página corretamente
  4. Confirmo que a próxima página está pronta para a digitalização
  5. Repita os dois passos acima até que eu diga ao scanner que não há mais páginas para vir
  6. O scanner salva tudo em um único PDF.

Eu tentei o xsane e o gscan2pdf. Primeiro problema: eles querem que eu saiba quantas páginas serão escaneadas. Isso já é um incômodo, mas eu posso fazer a contagem se necessário.

O principal problema é que na etapa 3, o scanner não faz uma pausa. É provavelmente otimizado para ser alimentado com folhas soltas. O próximo processo de varredura é acionado automaticamente assim que o CCD retorna à posição inicial. O tempo que o scanner precisa para retornar o CCD é muito curto e não consigo virar a página e posicionar o livro corretamente.

Existe um software que possa fazer o processo de digitalização da maneira que descrevi acima, ou eu simplesmente perdi uma configuração disponível em xsane ou gscan2pdf para fazer a pausa do scanner?

Se isso faz alguma diferença, o scanner é uma Epson Stylus SX620FW, eu o uso usando o driver fornecido pelo fabricante.

    
por rumtscho 20.10.2012 / 15:24

3 respostas

1

Na linha de comando, você pode usar scanimage --batch --batch-prompt --source Flatbed para verificar todas as páginas. Isso deixará você com arquivos .pnm (ou arquivos TIFF, se você adicionar --format tiff ), não um PDF, infelizmente.

Você não precisa contar as páginas - ele pede para você pressionar enter se houver outro, ou control-D, se não houver.

Existem vários fluxos de trabalho para obter de arquivos PNM para PDF. O mais fácil é usar apenas converter (parte do ImageMagick): convert page1.pnm page2.pnm page3.pnm doc.pdf . Você pode usar curingas shell (ou ImageMagick), é claro.

Você pode querer cancelar o papel no primeiro pnm.

    
por 21.10.2012 / 02:43
1

Eu recomendo VueScan .

Não é de graça, eu tenho medo. US $ 40 ou US $ 80, dependendo da versão. Ele lida facilmente com a digitalização de várias páginas, juntamente com o OCR e toda uma carga de otimizações automatizadas e manuais.

Eu tenho usado isso há anos, originalmente para digitalizar uma carga de slides quando descobri que o software nativo do scanner de slides da Canon era muito lixo.

O VueScan é multi-plataforma, rodando em Windows, Mac e Linux.

Por acaso, o VueScan fará uma pausa entre as páginas se você quiser & você faz com que pare por um determinado número de segundos.

    
por 20.10.2012 / 23:58
0

Gscan2pdf é o que funcionou para mim, mas as configurações foram inicialmente confusas. A seleção de "todas" páginas não deixa uma aparente maneira de interromper o processo de digitalização e parece projetada para um alimentador automático de documentos. Não há necessidade de contar as páginas.

Defina em 1 e irá digitalizar e parar. Quando a próxima página estiver pronta, pressione digitalizar novamente. Todas as páginas digitalizadas serão acumuladas. Ele faz um bom trabalho ao compactar as imagens para um arquivo final de tamanho razoável.

    
por 03.09.2014 / 04:00