Como posso transformar fotos de documentos em papel em um documento digitalizado?

36

Meu scanner quebrou! Eu tenho uma boa câmera, então tirei algumas fotos dos documentos que quero digitalizar ... No entanto, eles parecem fotos de papel, não documentos digitalizados:

  • As imagens não são planas
  • A iluminação não é uniforme (sombras à medida que a página é distorcida, etc)
  • O texto obviamente não é processado em texto PDF passível de cópia.

Eles simplesmente não são adequados para uso profissional, mas são próximos.

Estou procurando algo (ou método) que possa fazer qualquer um ou todos os itens acima, para que eu possa ir de vários arquivos JPG para um único PDF [opcionalmente] anotado da coisa toda, que está na direita formato (A4 tipicamente).

Alguma sugestão (falta de sair e comprar um novo scanner)?

    
por Oli 19.06.2015 / 10:40

3 respostas

41

Existem várias maneiras de fazer isso. Embora todas as minhas sugestões tenham um problema, por que você não vai realmente achatar sua imagem. Uma imagem mais a menos boa ainda seria necessária.

Uma maneira fácil é que você experimente o software ScanTailor

sudo apt-get install scantailor 

Leva você por 6 etapas para otimizar suas fotos. Na última etapa, você pode selecionar a opção "Igualar iluminação", que lhe dará uma aparência limpa e agradável!

Pessoalmente, costumo usar o GIMP . Mas você precisa de algumas habilidades básicas para alcançar seu objetivo.

sudo apt-get install gimp 
  1. recorte a foto da maneira desejada
  2. use o Colors - > Curves opção para manipular a saída de cores da maneira que você quiser ...

Outro programa interessante é gscan2pdf , onde você também pode carregar fotos e exportá-las como PDF. Existe até um link para o GIMP para que você possa melhorar a foto com o passo descrito acima .

sudo apt-get install gscan2pdf 
    
por wittich 19.06.2015 / 12:25
17

Para gerar uma cópia imprimível ou um PDF a partir de uma foto de câmera de um documento, temos que converter manualmente bastante para obter uma imagem semelhante à saída de um scanner. A maioria dessas conversões pode ser feita com o Gimp.

  1. Tente tornar a imagem melhor que você pode usar como fonte original :

    • Escolha uma luz brilhante para reduzir o ruído de pixels, mas, para evitar reflexos, sangramento ou dispersão de luz irregular, não use o flash, a menos que tenha um equipamento flash de estúdio.
    • Se possível, escolha acender a fonte de pelo menos dois lados (parte superior inferior ou direita esquerda)
    • Tire a foto de uma distância maior usando uma teleobjetiva em vez de uma lente grande angular.
    • Use um tripé para evitar artefatos de agitação.
    • Aponte a câmera ortogonal para a superfície da fonte.
    • Inclua algum espaço próximo da fonte original.
  2. Considere a dessaturação para escala de cinza para melhor contraste e remoção de artefatos de pixel coloridos.

  3. Ajusteobrilhoecontrasteparatornarofundocinzabrancopresumivelmenteeasletraspretascomopreto.

    • IssopodeserfeitorapidamentecomoGimpColors>Níveisferramentaondepodemosarrastaropontopreto(esquerda)eopontobranco(direita)ouescolherospontospreto/brancocomoseletordecores.

    • As sombras nos cantos dobrados não podem ser removidas sem também remover partes do texto (ver 6.)
  4. Remover a distorção da almofada?

    Dependendo da qualidade da nossa lente fotográfica e do nível de zoom que utilizamos, podemos ter alguns artefatos de amortecimento que levam à flexão das bordas externas do documento. Existem plugins para remover esses artefatos, mas podemos achar mais rápido escolher um nível de zoom da nossa câmera onde eles são mínimos. Depois do corte (5.), podemos nem notar mais. Portanto, remover artefatos de amortecimento pode ser necessário apenas no caso de nossa imagem de origem ter muitas linhas retas nas partes externas.

  5. Girar e crop ou perspectiva transformar a imagem, se necessário.

    Ao contrário de um scanner, nossa câmera pode não obter a fonte em paralelo às bordas da imagem. A ferramenta Gimp Rotate ou Perspective nos dará um feedback visual para poder girar ou ajustar a perspectiva de uma imagem até que as linhas de texto fiquem paralelas à página.


    FerramentadePerspectivanoladodireito

Agorapodemosselecionaraorigemdodocumentocomaferramentadeseleçãoderetânguloparacortaraimagemdentrododocumento.

  • Remova sombras indesejadas de dobras, dobras ou artefatos de vinheta da lente da câmera.

    • Essas sombras são difíceis de remover e não há um plug-in ou filtro automático para nos ajudar.
    • Poderíamos, em teoria, sobrepor um preenchimento gradiente a essas regiões, mas isso pode não levar aos resultados esperados, portanto, pode não valer a pena o tempo que precisaríamos.
    • O método mais rápido, portanto, é simplesmente usar a ferramenta borracha para remover todas aquelas sombras feias fora do texto (que devemos poupar).

      apagado->

  • Escala de imagem?

    Dependendo da resolução da câmera, a ampliação da imagem para um tamanho de imagem do scanner aumentará apenas o tamanho do arquivo, mas não terá nenhum benefício na qualidade da imagem. A redução de escala removerá os detalhes. Portanto, não devemos dimensionar a imagem, mas ajustar o tamanho da impressão na caixa de diálogo da impressora (ou abaixo em 8.).

  • Gerar PDF

    Podemos importar agora a nossa imagem bem restaurada manualmente para o LibreOffice ( Insert > Media ) para

    • Defina suas dimensões
    • Exportar como PDF
    • Imprimir (para mim, imprimir a partir do LibreOffice leva a um resultado desejado com muito mais frequência do que qualquer outra coisa).
  • por Takkat 19.06.2015 / 13:47
    1

    Se você já tem a imagem do documento, basta baixar o aplicativo CamScanner para seu telefone / tablet. Ele permitirá que você importe a imagem, em seguida, fará um corte sugerido e permitirá que você aplainar, bem como ajustar cores / contraste, etc. Leva apenas um minuto.

        
    por Dan 08.11.2016 / 03:14