Os hosts ESX perdem a conectividade com os SAN LUNs iSCSI

3

Estou com esse problema há alguns meses, onde meus hosts ESX perdem a conectividade com meus volumes vmfs iSCSI SAN.

Como resultado, os hosts ESX entram em um modo não responsivo, as VMs associadas são desconectadas e o único remédio é reinicializar o host.

Esse problema acontece aleatoriamente. Eu aumentei esse problema com o VMWare, mas ainda não tive nenhuma solução para o problema.

Não vejo erros nos meus switches e também não há problemas de hardware. Minha infra-estrutura SAN é sólida e existem 2 caminhos para cada volume de vmfs.

Alguém mais passou por um problema semelhante?

edite: Aqui estão mais alguns detalhes:

O software iSCSI SAN é o Datacore Sanmelody 2.0.4.2 executado em 2 servidores HP Proliant G5. O armazenamento anexado a cada um dos servidores é um HP MSA70 e todos os iSCSI SAN Volumes apresentados aos meus quatro hosts ESX são espelhados.

Eu tenho dois swithces iSCSI HP Procurve 1800G-24 que são troncalizados juntos. Meus servidores SANLELODY estão usando NICs NC360T. Eu uno duas NICs e tenho um cabo conectado a cada comutador iSCSi. Cada servidor ESX usa duas NICs também para a rede iSCSI.

    
por Basil 03.03.2010 / 10:55

4 respostas

1

Precisamos conhecer a versão do ESX para diagnosticar corretamente esse cenário.

Acertamos esse problema há algum tempo no ESX 3.5 Update 3, e a resolução era atualizar / corrigir os hosts, por este KB artigo . Após a atualização, para a Atualização 4 (e mais), o problema não ressurgiu.

Se você já passou por esse patch, pode fornecer mais detalhes sobre as versões e, possivelmente, alguns dados de diagnóstico de um dos hosts ESX? Normalmente, o vmkernel.log é um bom lugar para começar.

    
por 11.05.2010 / 07:20
0

Vamos tentar um pouco mais complicado. Tente usar outra solução iSCSI para verificar se é um problema do ESX ou do próprio iSCSI.

Vou redecomendê-lo StarWind . Você pode fazer o download do teste lá.

    
por 04.03.2010 / 16:32
0

Talvez seja necessário desativar os pings iscsi, conforme explicado aqui

    
por 11.04.2010 / 19:56
0

Eu tive um problema muito parecido com o ESXi 4, os switches HP Procurve e um HP Lefthand SAN. Nosso problema acabou sendo que, enquanto os iniciadores de iSCSI de hardware funcionavam, eles só funcionavam 99% do tempo, causando travamentos aleatórios, desconexões etc. Como se viu, as placas de rede Broadcom (com iSCSI de hardware) não são compatíveis com SANs do Lefthand. O uso de iniciadores iSCSI de software resolveu nosso problema.

    
por 03.12.2011 / 05:17