Geralmente, o epub será cerca de 10 vezes menor. Com um PDF, não apenas o texto é armazenado, mas também o local e a orientação de cada caractere. No caso de um documento com OCR, cada página é armazenada parcialmente como uma imagem.
Por outro lado, o EPUB é apenas HTML. Não há regras sobre onde o texto deve ir - o cliente EPUB tem total poder sobre o refluxo do texto e / ou reescalonamento. Devido a isso, um PDF de 3MB corresponderá a um EPUB de 300kb aprox. Se o PDF de 3 MB for digitalizado por OCR, o EPUB será ainda menor.
Imagens em PDFs são um pouco menores, no entanto.