Para abordar as questões específicas:
Is one storage format more scalable than the other?
O mbox tende a tornar-se difícil de gerenciar quanto maior ele recebe. Como ele armazena tudo em um grande blob, pode ser difícil fazer backup incrementalmente, e esse acesso bloqueará a mbox contra gravações enquanto isso acontece. Se houver alguma corrupção, é muito mais difícil tentar reparar ou recuperar - o que você pode dizer é um risco que aumenta à medida que armazena mais e-mails.
O Maildir conta com o sistema de arquivos subjacente para sua escalabilidade, pois caracteristicamente cria muitos arquivos pequenos, um por mensagem. Se você tem muitos e-mails, o Maildir geralmente é mais fácil e rápido de lidar.
Are there data integrity concerns / differences?
Sim, a principal é que o mbox requer o bloqueio de arquivos de leitura / gravação em todo o archive, o que significa que as leituras devem aguardar gravações e cada gravação individual deve aguardar todos os outros acessos. Se ele foi usado de forma que o bloqueio não seja possível, como em um compartilhamento NFS, o arquivo está sujeito a corrupção. Qualquer corrupção aleatória pode afetar todo o arquivo, em vez de uma única mensagem.
Com o Maildir, o bloqueio pode estar no nível da mensagem individual, para a maioria das operações, e a corrupção em qualquer arquivo afetará apenas essa mensagem. Quaisquer índices nas mensagens podem ser reconstruídos, se necessário, a partir das próprias mensagens.
Are there clearly defined situations where you should use one format over the other?
É mais o caso que o Maildir está começando a substituir o mbox como o formato preferido universalmente, sem inconvenientes significativos.
Sua principal limitação é a criação de muitos, muitos arquivos pequenos, que tinham a capacidade de sobrecarregar alguns sistemas de arquivos e / ou serem ineficientes dependendo do tamanho do cluster do sistema de arquivos. Este é um problema menor em sistemas de arquivos modernos. Ele também pode informar sua estratégia de backup, mas, no geral, oferece mais flexibilidade à sua escolha de estratégia de backup.