Um scanner de feed que lê dados

1

Eu não sei se este é o lugar certo para fazer esta pergunta, mas ...

Eu preciso de um scanner (scanner de alimentação de papel) onde, dependendo de um código de barras ou número, ou algum identificador no papel sendo digitalizado, crie um arquivo PDF com um nome baseado nesse identificador.

Por exemplo: se eu digitalizasse uma página com o número 12345 no canto superior esquerdo da página, um arquivo PDF chamado 12345.pdf seria criado.

Qualquer sugestão seria muito apreciada!

    
por kylex 28.05.2010 / 17:18

4 respostas

2

Se você estiver procurando um scanner de documentos que tenha a capacidade de separar lotes usando código de barras e renomeá-los com base em código de barras e OCR zoneado, tente fazê-lo com o Fujitsu Scanner. Outra opção é você usar o scanner Kodak com captura kodak, mas o software é vendido separadamente e custa muito caro. Se você tiver um scanner baseado em ISIS, pode experimentar o software Quick Scan Pro para fazê-lo. Eu usei scan all pro desde 3 anos atrás para digitalizar milhões de páginas e funciona bem.

    
por 07.10.2010 / 12:16
1

Você já viu coisas como Readiris ou SimpleOCR ou outro OCR alternativas para ver se algum deles tem os recursos que você é depois?

Eu escrevi um scanner de documentos usando o Microsoft Access VBA que pode pegar páginas de um scanner de alimentação de documentos e gerar arquivos pdf, e atualmente estou reescrevendo-o em Python, mas ainda não fui incomodado o suficiente para descobrir como para criar algum tipo de OCR, pois não parece haver muitas opções para o OCR em Python. Leitores de código de barras parecem ser uma opção, pois geralmente você pode obter aqueles que apenas fornecem um fluxo de dados serial com o conteúdo do código de barras, o qual poderia ser usado como o nome do arquivo ...

Parece o tipo de coisa que deve estar disponível na forma de soluções OCR pagas, acho que você pode precisar avaliar quais pacotes suportam a digitalização de documentos em massa e a economia de arquivos baseada em regras.

    
por 28.05.2010 / 18:25
1

Isso funciona no Linux para o caso de um número no topo da página. Você pode jogar com os parâmetros de varredura e os parâmetros de conversão de pdf para obter o que você quer (compressão, etc).

#!/bin/bash
# Requires scanimage, tesseract and ImageMagick convert

# Scan the image to temp file. Change command for your scanner
scanimage -d hpaio:/usb/Deskjet_F4100_series?serial=CN7CH4T29D04TJ \
--mode Lineart --resolution 300 --compression None --format=tiff \
> out.tif

# OCR to tmp.txt file
tesseract out.tif tmp

# Extract first line --contains number (thanks Serverfault 66587)
read -r NUMBER < tmp.txt

# Convert image to pdf with the desired name
convert out.tif $NUMBER.pdf

# Clean up
rm out.tif tmp.txt

Se preferir códigos de barras, experimente processar a imagem com gocr. Ele vai ler alguns tipos de códigos de barras. Extraindo o resultado número é um pouco complicado, mas pode ser feito com um filtro sed.

    
por 28.05.2010 / 19:46
0

Desculpe por responder a um tópico de 3 anos de idade, mas eu estava em busca de algo assim também no lugar onde trabalho. Depois de algumas pesquisas, me deparei com Batch Scan To Pdf exatamente faz o que você precisa em sua descrição. Em vez de códigos de barras regulares, eles usam QR-Codes. Eles são super baratos em comparação com outros que eu já vi. Espero que isso ajude outras pessoas que possam precisar de funcionalidades semelhantes.

    
por 18.09.2013 / 20:38

Tags