Cenário de falha de hardware do cluster ESXi 5x

2

Olá, engenheiros fellas.

Eu tenho uma configuração de cluster ESXi5.0 com 3 hosts ESXi. Agora preciso criar um caso de teste para falha de hardware de rede e executar o teste no datacenter.

My Setup:

    1) 3 DELL R820 Servers (all identical in the configuration and hardware)

    2) PHYSICAL: Pair of 1GB ports for vSphere Management Network (active/standby)
       VIRTUAL: 1 VMkernel Port vmk0 on standard vSwitch0

    3) PHYSICAL: Pair of 10GB ports for regular network communications between guests MESH(active/active using IP Hash load balancing connected to the redundant switches) 
       VIRTUAL: dvSwitch0 with exposed and needed VLANs.
    4) PHYSICAL: Pair of 10GB for storage NFS/VMDK (active/passive, Failover Only with "Link Status Only" network failure detection connected to different switches)
       VIRTUAL: 1 VMkernel port vmk1 connected to distibuted switch dvSwitch01
    5) PHYSICAL: Pair of 10GB for storage (guest initiated) (active/active, load balancing is based on Port ID with "Link Status Only" network failure detection connected to different switches)

HA and DRS enabled.

Eu estava planejando fazer testes regulares de cabos, mas pode estar faltando alguns fatores. Eu gostaria de receber sugestões e / ou práticas recomendadas para realizar esse teste.

    
por Danila Ladner 28.08.2013 / 17:22

3 respostas

4

- Desligue um host. - Para testar a alta disponibilidade e o controle de admissão.

- Desligue um switch. - Para testar links de failover.

- Desconecte dados e cabos de rede de armazenamento de forma independente. - Para testar a resiliência, o balanceamento de carga e o estado de isolamento de host / heartbeat do armazenamento de dados. Também o failover do controlador de armazenamento.

    
por 28.08.2013 / 17:30
1

Quando testamos cenários de falha, começamos removendo fios / fibras individuais, em seguida, NICs / HBAs inteiros, servidores e switches - ou seja, pequenos a grandes - simplesmente porque, se a plataforma não consegue lidar com os pequenos, testar nos grandes será inútil.

Dito isso, não vejo nenhum problema com sua configuração, não como você explicou de qualquer maneira.

    
por 28.08.2013 / 17:30
0

Eu mais vou na grande abordagem - desconecte um servidor e na próxima tentativa de armazenamento e no último um switch - ou em qualquer outra ordem - se o sistema sobrevive a isso - > tudo bom. Mas se você tiver muito tempo (e alguém para pagar), você pode tentar cada pequeno problema sozinho ...

Tsg

    
por 28.08.2013 / 19:27