para a segunda parte da sua pergunta, eu recomendaria djvusmooth .
para a primeira parte da sua pergunta, eu sugiro que pdfchain abranja seus requisitos
ambos estão disponíveis no Centro de Software.
Eu pessoalmente uso um comando no terminal para extrair texto:
pdftotext -layout *.pdf anyname.txt
isto irá exportar o texto do pdf para um arquivo, o que significa que você pode editar o texto em um editor de texto.