Estou tentando pesquisar vários arquivos PDF para um padrão usando o pdfgrep. O comando que estou usando é
pdfgrep --color always <pattern> */*.pdf > outputFile
Estou direcionando a saída para um arquivo, porque o comando produz uma quantidade enorme de saída. Se eu digitar cat outputFile
, tenho um problema com linhas longas, conforme ilustrado a seguir, ou seja, há lacunas nas linhas e algumas letras e palavras ausentes:
ARE249/LewandowskyEtAl_PsychSci_2016.pdf:referred to as worldview or cultural cognition—is a major because if an overwhelming scientific consensus cannot
ARE249/LewandowskyObenhauerGignac_PsychSci_2016_annot.pdf:referred to as worldview or cultural cognition—is a major because if an overwhelming scientific consensus cannot KIRIVEXIH
ARE249/Lewandowsky_Oberauer_MotivatedRejectionofScience_2016.pdf:apparent than with climate science. The overwhelming and Slovic (2013). The tables in panel (a) of Figure 1
ARE249/Lewandowsky_Oberauer_MotivatedRejectionofScience_2016.pdf: In summary, the rejection of specific scientific evi- in panel (b) of Figure 1. Liberals overwhelmingly arrived
ARE249/Lewandowsky_Oberauer_MotivatedRejectionofScience_2016.pdf:to decrease as a result of gun control, whereas they failed are motivated to reject an overwhelming scientific con-
ARE249/Mans
bridge_SolnsToPolarization_Ch2_annot.pdf:
Um problema relacionado é visualizar o arquivo de saída. Se eu canalizar para more
, a saída parece ok, mas eu realmente gostaria de poder rolar para cima e para baixo na saída. No entanto, se eu canalizar para less
eu recebo muitos ESCs, como em
ESC[35mESC[KARE249/Kahan_VaccineRisk_2014.pdfESC[mESC[KESC[36mESC[K:ESC[mESC[Kone in the PUBLIC_HEALTH scale. The sample-wide scores on that scale reflected an ESC[01;3
Uma alternativa seria exibir outputFile através de um editor, no entanto, em vi
e emacs
obtém uma saída semelhante à saída de less
.
Alguém tem alguma boa solução para esses problemas? Obrigado!