O que poderia estar errado com minha configuração iscsi do XenServer após uma recente queda de energia

1

Acabamos de sofrer uma queda de energia devido a uma tempestade com raios. A interrupção foi longa o suficiente para reiniciar servidores e switches. Temos dois hipervisores XenServer em execução no mesmo pool. No início, os dois pareciam estar bem e funcionando normalmente. Ambos estão conectados ao SAN Equallogic usando os mesmos switches.

Então percebi que um deles está constantemente enviando erros de iscsi em / var / log.

mensagens

Jul 20 23:27:29 hkixen01 kernel: [ 1266.132897]  connection1:0: detected conn error (1020)
Jul 20 23:27:30 hkixen01 iscsid: Kernel reported iSCSI connection 1:0 error (1020) state (3)
Jul 20 23:27:32 hkixen01 kernel: [ 1269.232077]  connection1:0: detected conn error (1020)
Jul 20 23:27:33 hkixen01 iscsid: Login authentication failed with target iqn.2001-05.com.equallogic:0-1cb196-559bd552f-84749b57a93535a3-xen
Jul 20 23:27:34 hkixen01 iscsid: connection1:0 is operational after recovery (1 attempts)

SMlog

Jul 20 20:55:47 hkixen01 SM: [7935] ***** generic exception: vdi_deactivate: EXCEPTION SR.SROSError, The VDI is not available [opterr=LV scan error]

Quando inicio as máquinas virtuais no hipervisor com os erros, o uso da CPU atinge 100% na guia de desempenho da máquina virtual. As máquinas virtuais estão presas na inicialização e não respondem mesmo depois de esperar por algumas horas. No momento, não podemos usar o hipervisor problemático para hospedar qualquer máquina virtual. Qual poderia ser o problema? Parece não haver problemas com o outro hipervisor.

    
por Wilbis 21.07.2014 / 12:29

2 respostas

1

Após uma falha grave (falta de energia), não é incomum que isso aconteça.

Você deve primeiro determinar se o XenServer está se conectando ao SR primeiro e depois determinar a integridade do VDI.

Conexão / Configuração link

VDI não disponível link e / article / CTX138234

    
por 21.07.2014 / 19:55
0

O problema foi resolvido. Tínhamos uma porta defeituosa em um de nossos switches e isso fazia com que os pacotes grandes não fossem entregues. Pacotes menores eram entregues normalmente e dificultavam a detecção do problema.

    
por 25.07.2014 / 14:33