Is PDF very inefficient?
Não particularmente, como mostra seu comentário ao Q:
'cos the PDF of 10 greyscale pics, is 6.35MB!
Tudo depende da resoução e do nível de compactação.
Fundamentalmente, a resposta é: as páginas completas são muito grandes e as resoluções típicas de digitalização e impressão são bastante altas: assim, muitos dados.
Cálculo básico:
A4 tem cerca de 8,3x11,7 polegadas (a letra é semelhante, diferente não é significativo). Então, uma página é 97 em 2 .
A 300dpi, 1in 2 é 90.000 pixels. Com 24 bits por pixel (o suficiente para 16 milhões de cores), é cerca de 260kB.
Portanto, 100 em 2 exigirão cerca de 26MB. Isso corresponde aos seus números. A escala de cinza NB com 8 bits por pixel (256 níveis) requer cerca de um terço disso.
1GB de arquivos intermediários
Mas se você quiser uma saída final de 300dpi você realmente precisa trabalhar uma resolução maior até o estágio final de saída (para evitar artefatos: tente abrir e salvar um JPEG com compressão moderada algumas vezes para ver como esses aparecer).
Meu antigo scanner (> 8 anos de idade?) operaria a 2400dpi (IIRC), então algo como 600dpi estaria na faixa fácil da maioria dos scanners, já que é a medição linear, a área e, portanto, arquivo tamanho - aumentará com o quadrado, levando a tamanhos de arquivos quatro vezes maiores.
Ou seja. ∼100MB por imagem, então 1GB por 10 é esperado.
Mas o resultado final é muito menor
Isso é quase certamente comprimido. A compactação não-frouxa de imagens com grandes áreas de cores constantes pode ser comprimida por x10 sem perda significativa de informações percebidas, para digitalizações e fotos (que tendem a ter pequenas variações que só vemos em níveis de zoom extremos ) alguma perda é normal (como o JPEG usa) e taxas de compressão similares são alcançadas.
Quão grande poderia ser?
As Pro-DSLRs usam 14bits por cor (um scanner de ponta também deve ser capaz), ou seja, 42bits por pixel. Digitalizar A4 a 4800dpi levaria a um tamanho de dados brutos de GB11GB para uma única página.