Estou planejando um pequeno servidor independente do ESXi para hospedar um número de VMs que eu uso aqui. Ainda não decidi quais instalações usar do sistema vSphere mais amplo. O armazenamento subjacente da VM é o RAID de HDD local usando HDDs corporativos e megaraid do LSI, com os sistemas de armazenamento em cache RAM + ssd da bateria interna da placa LSI ativados.
Minha preocupação está relacionada à corrupção de dados e à podridão de bits no armazenamento da VM ao longo do tempo - realmente não sei quais são minhas opções e gostaria de ter certeza de que VMDKs e snapshots armazenados e outros arquivos de VM não não é corrompido com o tempo e pode ser configurado para ser periodicamente limpo e qualquer dano no nível de bits (dentro da razão) detectado e reparado.
Como pano de fundo, para o uso casual de desktops, eu costumava usar RAID 1 (espelhamento) em vez de níveis mais altos (motivos: velocidade de leitura rápida, portabilidade completa de unidades sem vinculação a marcas ou cartões específicos, sem interrupção uma unidade falha). Para o meu servidor de arquivos, uso o ZFS em um volume espelhado. Mas o conjunto de ESXi e VMware usa seu próprio design de armazenamento de dados para armazenamento local. Então, eu não sei quão resiliente contra a corrupção silenciosa, uma configuração seria "pronta para uso", especialmente quando ela contém muitos TBs de arquivos grandes que às vezes só podem ser acessados anos depois, e com uma loja local em vez de uma dedicada sistema de armazenamento separado. Eu também recolho que o VMFS usa um sistema de arquivamento em diário, mas não um com a capacidade de auto-correção do ZFS.
Os recursos internos do ESXi (e, se necessário, outras partes de seu conjunto) são suficientes para proteger contra as preocupações comuns de corrupção de dados? Se não, quais são minhas opções para a paz de espírito?
Atualizar
@mzhaase - Eu não me sentia confiante em passar para um segundo servidor que funcionaria como um repositório de arquivos, porque todos os acessos a arquivos e snapshots têm que ser feitos remotamente através de uma LAN ou de um segundo dispositivo e até mesmo se 10G foi utilizado (o que ainda é um custo proibitivo para a maioria das configurações domésticas), a desaceleração seria uma grande preocupação.
Parte de todo o motivo para obter esse cartão específico é obter velocidade de cache-on-write real, de modo que as gravações ou reversões em massa têm menor probabilidade de reduzir a velocidade "drenando" os HDDs principais, o que deve ser útil seja qual for o local do armazenamento de arquivos. Problemas com impacto de latência parecem que também aconteceriam com qualquer armazenamento de dados remoto, quando um dispositivo de servidor ou uma construção caseira, como uma segunda caixa FreeNAS (embora, se eu tivesse que escolher, usaria um segundo FreeNAS).
Talvez eu esteja negligenciando o uso de uma porta NIC dedicada e várias portas paralelas de 1 Gb para contornar isso, mas as implicações de latência e tráfego para instantâneos e reversões são uma grande preocupação. Também estou possivelmente negligenciando a execução de uma VM FreeNAS em um pequeno disco dedicado, que presta serviços de manutenção ao array de armazenamento da VM principal do cartão de ataque como um dispositivo de passagem, o que o mantém local. (Isso significa que o ESXi pode inicializar e carregar o FreeNAS VM em um disco, uma vez que ele esteja em execução, ele pode atuar como um servidor de arquivos baseado em ZFS para qualquer outro VMS com - esperançosamente - baixa latência). Mas a execução do servidor de arquivos virtualizado pode aumentar a latência mais do que mantê-lo local, o reduziria e a latência e os gargalos de disco já são um problema que estou tentando superar.
No entanto, procurarei as informações da placa LSI e - você poderá instalar o software de verificação / reparo de integridade de arquivos na plataforma ESXi subjacente para verificar e reparar os arquivos da VM? Eu não sabia disso. E seria o iSCSI muito mais um matador de latência para tornar um armazenamento remoto utilizável? Quando uma VM está em funcionamento, quanto a velocidade / latência do acesso ao armazenamento de VM afeta a execução do ESXi ou de outras VMs atualmente em execução?