ZFS + FreeBSD + virtualbox

3

Estou configurando um servidor virtual do FreeBSD que hospeda meia dúzia de servidores de e-mail ocupados e de missão crítica. Acabei de aprender o ZFS, estou bastante atraído, mas tenho algumas perguntas:

  1. qual é a sobrecarga da CPU do ZFS? Eu pesquisei e encontrei pouco (ou nenhum) ponto de referência para isso.

  2. pelo que aprendi, quando o ZFS atualiza arquivos, ele mantém o arquivo antigo como instantâneo e grava a parte atualizada da nova versão. No entanto, isso significaria para cada snapshot que ele exige uma sobrecarga de armazenamento significativa. Quanto custa essa sobrecarga de armazenamento? Por exemplo, suponha que eu tenha 2TB de espaço utilizável, quanto espaço pode realmente ser usado para a versão mais recente dos arquivos um ano depois?

  3. o FreeBSD com o virtualbox de hospedagem do ZFS atende a meia dúzia de servidores de e-mail de missão crítica de hóspedes ocupados uma combinação razoável? Alguma coisa em particular para ter cuidado? E ainda posso escolher o ZFS para os sistemas operacionais convidados? Isso porque eu posso construir outra caixa idêntica para redundância, e será necessário fazer algum espelhamento entre cada par de sistemas convidados nas caixas.

  4. Estou tentando configurar um Dell R710 para isso. Pelo que eu aprendi, eu não deveria escolher nenhum RAID, isso é verdade? Nesse caso, as unidades ainda chegam em hot swap?

  5. isso pode soar um pouco patético, mas como não tenho nenhuma experiência com o ZFS, e esse é um servidor de missão crítica, basta perguntar: Se eu estiver escolhendo processadores Intel L5630 gêmeos e 6 Unidades SCSI Serial-Attach de 600 GB e 15K RPM. Se eu precisar de mais espaço no futuro, bastaria trocar alguns drivers com maior capacidade para expandir o armazenamento. Não há problema com isso, certo?

por John 28.01.2011 / 08:40

5 respostas

4

Tenho experiência com o ZFS em execução no OpenSolaris em um servidor de arquivos NFS de 50 TB para HPC, portanto, responderei suas perguntas com base nisso.

Pergunta 1

What is the CPU overhead of ZFS?

É muito pequeno. Ele irá variar dependendo de quais algoritmos de soma de verificação e compactação você escolher e você habilitar a deduplicação. Eu tenho todos os 3 permite com as opções padrão e raramente obter meus 16 núcleos para utilizar mais de 15% cada. Lembre-se de que a compactação e a dedução também reduzem a quantidade de dados que você precisa gravar para que as coisas realmente acabem acontecendo mais rapidamente às custas da menor utilização da CPU. CPUs são muito rápidas hoje em dia.

Questão 2

From what I learned, when ZFS updates files, it keeps the old file as snapshot, and write the updated part for the new version. However that would mean for each snapshot it keeps that require significant storage overhead. How much is this storage overhead? For example, suppose I have 2TB usable space, how much space can actually be used for the latest version of files one year later?

Os instantâneos armazenam apenas uma diferença do que foi alterado. Você só começa a ver os instantâneos ocupando espaço se você excluir ou modificar os dados existentes. Para o servidor de email que armazena emails em texto simples, isso significa que apenas os emails excluídos resultarão em sobrecarga nos instantâneos. Se você acumular 1,5 GB (após a compactação do ZFS) de e-mails e 0,5 GB forem excluídos com o tempo, você poderá colocar tudo em seu zpool de 2 GB, independentemente do número de snapshots criados.

Ter um ou mais instantâneos significa que você não poderá liberar espaço excluindo arquivos, mas poderá liberar espaço excluindo os instantâneos.

O ZFS é um fs transacional, portanto, mesmo a exclusão de um instantâneo exigirá a gravação de um pequeno log no disco. Isso significa que, se você tiver 0 bytes de espaço livre, não poderá excluir. Eu fiquei preso assim uma vez. Portanto, tome cuidado ao configurar uma cota de espaço em disco (digamos, 99% do seu zpool) para que, quando ficar sem espaço, você possa realmente excluir as coisas.

Pergunta 3

Is FreeBSD with ZFS hosting virtualbox serving half dozen busy guest mission critical mail servers a reasonable combination? Anything particular to be careful with? And can I still choose ZFS for the guest OSs? This is because I may build another identical such box for redundancy, and will need to do some mirroring between each pair of the guest systems across the boxes.

Eu não sei quão bem o VirtualBox funcionará sob esse tipo de carga. Você deve testar o desempenho antes de implantar. A replicação seria a melhor com zfs send .

Pergunta 4

I'm trying to configure a Dell R710 for this. From what I learned, I shouldn't choose any RAID at all, is that true? In that case, are the drives still arrive hot swappable?

Se você formatar as unidades como JBODs, poderá usar o ZRAID do ZFS. Eles serão hot swappable.

Temos uma SAN da LSI e não usamos o ZRAID. Em vez disso, contamos com o hardware RAID6. Houve casos em que o ZFS detectou corrupção de dados e eu consegui identificar quais arquivos foram afetados. Os dados foram restaurados posteriormente pelo hardware, mas se tivéssemos o ZRAID, não haveria nenhuma corrupção de dados visíveis no nível do arquivo.

Questão 5

If I need more space in the future, I would just hot swap some drivers with larger capacity to expand the storage. There is no problem with these, right?

É uma boa pergunta. Isso seria um problema se você fizer o RAID de hardware. Por outro lado, o ZFS deve permitir que você expanda assim com o ZRAID. Eu nunca me cansei disso. Ao expandir, apenas adicionamos novas prateleiras e criamos novos zpools. Cultivar os zpools existentes seria tão fácil quanto adicionar novos.

    
por 22.02.2011 / 01:53
3

Vou abordar o # 3 aqui. Eu não acho que o VirtualBox + FreeBSD + ZFS seja a melhor solução para o que você está propondo (baseado no uso de "missão crítica" e "ocupado").

  • O que você espera conseguir usando o ZFS? É um ótimo sistema de arquivos e sou definitivamente um defensor, mas que valor isso acrescenta nesse caso? Instantâneos? Checksumming? (pessoalmente, precisei de várias tentativas e muita pesquisa antes de começar a hospedar aplicativos críticos no ZFS).

  • Eu entendo que você é novo no ZFS, mas como está sua experiência com o FreeBSD e o VirtualBox?

  • Haveria algum problema com a execução de uma única instância do software de email e com a hospedagem de vários domínios, ou você precisa do isolamento completo proporcionado pela virtualização?

  • Se você optar por usar o ZFS, não desejará os controladores Perc RAID tradicionais, mas deverá especificar algo que transmita as unidades SAS RAW para o sistema operacional. Consulte: Recomendações do controlador ZFS SAS / SATA (BTW - suas unidades ainda seriam hot-swappable).

por 28.01.2011 / 15:05
2

Você não pode rodar seus servidores de email em cadeias do FreeBSD (veja a porta do ezjails). Você pode colocar os jails individuais nos sistemas de arquivos zfs e, assim, ter todos os recursos de snapshots.

Dito isso, qual sistema operacional e software seu convidado vbox deve rodar? Agora que o 8.2 está (quase) fora, ele vem com muitas melhorias nesses departamentos. E para 9.0, há muito mais vindo.

    
por 22.02.2011 / 00:30
1
Em poucas palavras, o ZFS é bom para um servidor que executa o Virtualbox, mas você realmente não deve colocar os discos rígidos na mesma máquina que as máquinas virtuais. O ZFS pode usar toda a RAM que você lança nele, o que é difícil de fazer em um servidor VM. Mas em um servidor de armazenamento especializado, você pode configurar o ZFS corretamente, aproveitar instantâneos para backups e assim por diante. O ideal é usar o iSCSI para se comunicar entre os servidores da VM e os servidores de armazenamento.

Adicionada explicação para responder ao comentário ... Observe que os instantâneos não são backups, mas podem ser usados para fazer backups. Em outras palavras, desligue o software do servidor db ou similar, captura instantânea e reinicie o software. Em seguida, inicie o backup usando o instantâneo como a origem. Seu tempo de inatividade é apenas o tempo necessário para desligar e reiniciar o processo de missão crítica. É por isso que os instantâneos são tão úteis.

    
por 22.02.2011 / 02:52
0
  1. agora muito do que eu conheço, a principal sobrecarga é que ele deveria ter RAM suficiente para funcionar
  2. os instantâneos não são feitos em cada atualização, mas somente se você (manualmente ou com um script) criar instantâneos; O espaço necessário é o mínimo possível, pois está usando uma abordagem de cópia-em-gravação (os blocos no arquivo antigo que foram modificados no novo)
  3. Eu realmente uso o FreeBSD e o ZFS, mas cuide-se que a máquina virtual tenha RAM suficiente atribuída a ela

Cerca de 4 e 5, não tenho certeza disso.

    
por 28.01.2011 / 12:40