Girar automaticamente a imagem de texto digitalizada (OCR via linha de comando?)

1

Posso girar automaticamente uma imagem que contém principalmente texto? Talvez via OCR? O algoritmo ou qualquer outra coisa precisa digitalizar a imagem e decidir se ela precisa girar 90 °, 180 ° ou 270 °

Eu quero incluir esse recurso em um script existente do PowerShell, portanto, a capacidade da linha de comando é obrigatória.

Estou aberto para soluções ImageMagick

Exemplo


Cliqueparaampliar

EujáliasseguintesperguntasdoSO.Maselesrodamfotos.
eestouapenastentandogirarasvarredurasdetextopuroquenãopossuemmetadadosEXIF.

por nixda 19.03.2014 / 20:37

3 respostas

1

Atualmente, faço isso com tesseract usando os switches "-psm 0", que detectam a orientação do imagem.

Exemplo de saída:

Tesseract Open Source OCR Engine v3.04.00 with Leptonica
Orientation: 3
Orientation in degrees: 90
Orientation confidence: 3.94
Script: 1
Script confidence: 13.81

Em seguida, corro ImageMagick para girar a imagem para a orientação correta. Ele funciona para a maioria das imagens, exceto documentos e fotos escritas à mão.

Um pouco desajeitado, mas é muito mais rápido do que executar o OCR quatro vezes.

    
por 18.06.2015 / 02:10
0

Você deseja o utilitário ImageMagick convert . Apenas corra

convert -rotate 90 image.png

e ele será girado em 90 graus e salvo novamente como o mesmo nome de arquivo.

    
por 19.03.2014 / 20:54
0

Não é a maneira mais elegante, mas você poderia tentar o OCR em todas as quatro orientações e o que tiver a menor quantidade de rabiscos é o correto. Fiz uma pesquisa rápida e encontrei algumas referências que discutem o uso de tal técnica, por exemplo, :

Phase two of document correction is the contextual auto-rotate. Using a full-page OCR read at several orientations the software can determine at which orientation the quality of the read is best. This is the most accurate way to rotate a document. Documents with little text, or text at various angles are the only risky documents. In these cases, the software chooses the orientation of the MOST readable text.

    
por 25.03.2014 / 03:27