PDFs não armazenam ou usam informações XSLT - eles são um formato de linguagem de marcação completamente diferente, que não tem uma strong divisão entre formatação e conteúdo como XML / XSL.
O motivo pelo qual você não encontrou nenhuma maneira automática de converter de um PDF para um XML / XSL é porque isso depende muito dos arquivos e formatações específicos que estão sendo usados, e então seria quase impossível escrever algo genérico realmente funcionou.
Sua melhor aposta seria extrair o conteúdo de texto dos arquivos PDF usando algo como pstotext e, em seguida, escrever um script personalizado para criar um arquivo XML daquele que corresponde ao original. Isso seria essencialmente uma solução única e seria bastante frágil e propenso a quebras.
Uma solução melhor seria apenas arquivar os PDFs.