O GFS2 / OCFS2 via DRBD permite que um par de servidores execute dual primary como armazenamento em cluster. Seus frontends da Web seriam extraídos desse par compartilhado. Você poderia ter várias cabeças compartilhando uma única mídia FC conectada usando também, ou, poderia usar o NFS para ter um único sistema de arquivos compartilhado usado por cada front-end da web. Se você usa o NFS com o DRBD, lembre-se de que você só pode executá-lo no modo primário / secundário devido à falta de bloqueios do cluster. Isso poderia reduzir seu throughput potencial pela metade.
O GlusterFS parece mais com o que você está procurando. Ele terá algumas peculiaridades exclusivas, ou seja, arquivo solicitado no nó que ainda não o possui, a pesquisa de metadados diz que ele está lá, é transferido de um dos nós replicados e depois é exibido. A primeira vez solicitada em um nó terá algum atraso dependendo do tamanho do arquivo.
O OpenAFS também é outra possibilidade. Você tem armazenamento compartilhado, cada recurso local tem um conjunto local de itens usados recentemente. Se o mecanismo de armazenamento ficar inativo, seus pools de recursos locais ainda serão veiculados.
O HDFS do Hadoop é outra alternativa que apenas "funciona". Um pouco complicado de configurar, mas também atenderia aos seus requisitos. Você terá muito conteúdo duplicado ao usar um sistema de arquivos distribuído.
Outro método sujo seria ter caches sendo executados em cada um de seus front-ends da Web que extraem conteúdo estático / carregado de uma única máquina e usam Varnish em cada um dos frontends para manter uma versão em cache de sua cópia única. Se a sua única máquina falhar, o Varnish armazenará em cache os itens existentes até o período de tolerância, e novos itens serão perdidos.
Grande parte disso se baseará na confiabilidade de um back-end que você precisa. Sistemas de arquivos distribuídos onde suas máquinas locais são um nó replicante provavelmente terão vantagem sobre a velocidade, já que não envolvem operações de rede para obter os dados, mas, com os cartões gigE e 10G sendo baratos, você provavelmente não experimentará latência significativa .