Eu descobri uma maneira de fazer isso sem muito esforço. Eu configurei a minha própria instalação do Mediawiki e importei o XML (eu precisava aumentar os limites na configuração do PHP - os que concentravam o tempo máximo de execução e o tamanho do arquivo enviado). Demorou bastante tempo no meu netbook. Na página de resultados, eu poderia copiar a lista das páginas e usar egrep -v
para filtrar as páginas que não são de conteúdo, como perfis de usuário, discussões, modelos, etc.
Então eu instalei EPubExport . Eu visitei a página Special:EpubPrint
e copiei a lista de páginas filtradas. Gerar o e-book demorou séculos e depois converter o EPUB para .mobi foi mais duas horas. O arquivo de saída é suspeitamente longo (duvido que os usuários tenham escrito tanto conteúdo quanto Mitchell fez no livro "Cloud Atlas"), mas a julgar pela pré-visualização, parece legítimo. Não tem imagens porque não estavam no XML, no entanto. Vou lê-lo assim que tiver mais tempo livre e deixar você saber como funcionou no longo prazo. Se você quiser ler o e-book sozinho, ele pode ser encontrado aqui . Você precisará ir para o artigo "Deus Ex", porque eu esqueci de cortar a página de índice do arquivo de saída.