Um sistema de arquivos em cluster é aquele que pode manipular vários computadores, de forma independente, acessando o mesmo armazenamento. Por isso, tem que lidar, por exemplo, com o armazenamento subjacente pode mudar inesperadamente (porque um dos outros computadores escreveu para ele).
Compare isso ao RAID1 (por exemplo, porque é simples de entender): tudo que faz é pegar a requisição do sistema de arquivos para "gravar dados X no setor Y no dispositivo A" e escrever X no setor Y nos dispositivos B e C Ou a solicitação do sistema de arquivos para "ler o setor Y no dispositivo A" para uma leitura do setor Y em B ou C (que contém exatamente os mesmos dados). É completamente transparente o sistema de arquivos - o RAID apresenta um dispositivo de bloco que se comporta exatamente como se espera dos dispositivos de bloco.
Basicamente, espera-se um dispositivo de bloco (esta não é uma definição formal):
- permite ler / escrever em setores em ordem arbitrária
- se você gravar dados D no setor X, então, qualquer quantidade de tempo depois, leia o setor X, ele deve retornar D.
Os dispositivos RAID fazem isso (na verdade, eles são melhores que os discos reais). Um disco compartilhado, como você usaria para um sistema de arquivos em cluster, não: em particular, ele viola o segundo ponto de bala, já que outra máquina pode ter escrito os dados D₂ para aquele setor nesse meio tempo.
As funções do LVM são semelhantes ao RAID, já que ele está apenas remapeando números de setores, mas de uma maneira que preserva o comportamento do dispositivo de blocos. Pode, por exemplo, enviar os setores 1-100 para o dispositivo A e os setores 101-200 para o dispositivo B, mas isso ainda preserva esses comportamentos (desde que A e B se comportem, é claro).