Se você gostaria de ter apenas o texto, sem muita formatação, você poderia tentar este comando:
less yourfile.pdf >> output.txt
Se o documento não tiver o "enxame de marcas de traços e traços" na digitalização original, normalmente tenho ótimos resultados com este site para reduzir o tamanho do PDF.