Minha solução seria 2 partes 1) continuar a usar o programa IntraPDF PDF to JPG (paguei por ele) ( link ) na minha plataforma XP (parece não funcionar no Windows 7 Home 32bit, trava).
Mas eu concordo com você, @geekosaur, com o PDF e HTML tendo metas diferentes, portanto a tradução / conversão não será exata (mesmo com CSS aplicado ao HTML, talvez) e, na verdade, o HTML resultante que eu vi em algumas páginas tem formatação que não é a mesma coisa, mas isso serve.
Assim, a segunda parte da solução seria usar a ferramenta de aplicativo gratuito IrfanView para converter de PDF para JPG, sendo o documento PDF uma série de imagens JPG, uma para cada página do documento. Isso é fácil de configurar, a visão do IrfanView empacota a conversão de PDF como parte de seu pacote de plug-ins, e o pré-requisito para o PDF é baixar o GhostView, ao qual o IrfanView fornece um link. Isso funciona muito bem, exceto que durante o processo, a interface do usuário às vezes trava, mas a conversão continua.
Para esclarecer o meu objetivo, eu queria os documentos em formato PDF em um formato não proprietário que me proporcionaria mais possibilidades de visualizar os documentos no futuro. PDF é bastante onipresente, mas eu gosto de meus dados para ser livre como não vinculado a um formato.
Obrigado a outros colaboradores: