Extraia o número de páginas de PDFs recursivamente e copie-os para um CSV

1

desculpas pela pergunta bastante trivial, mas eu sou um iniciante linux. Eu preciso obter uma lista de PDFs em várias sub-pastas de uma estrutura de diretórios e o número de páginas de cada arquivo PDF. Tudo salvo em um arquivo csv, por exemplo, <filename>,<number_of_pages> .

Eu usei fd e qpdf para extrair o número de páginas recursivamente:

fd ".pdf" --type f -x qpdf --show-npages {/}

Eu tentei incorporar echo ou printf na linha de comando para gerar o csv, mas sem sucesso.

    
por Marco 19.11.2018 / 09:38

1 resposta

1

Tenha em mente que acabei de instalar fd , então esta é minha primeira experiência com ele. Como não funcionou como eu esperava, escolhi uma abordagem diferente e canalizei a saída de fd para um loop Read-While e atribuí-lo a variáveis.

fd -e pdf -x echo {} | while read -r line; do var1=$line && var2=[your qpdf command]; echo "var1,var2" > myfile.csv; done

Devo observar que também não tenho RTFM-ed. ;)

    
por 19.11.2018 / 11:54

Tags