O disco iscsi da VM trava em um host VM, não no outro

1

Eu tenho uma solução VmWare em execução em um bladesystem da HP com um ISCSI san da Lefthand. Atualmente, existem dois hosts VmWare nesse ambiente.

Eu tenho dois Debian VMs compartilhando um disco ISCSI (com ocfs2), montado diretamente do san usando open-iscsi. Tudo funcionou perfeitamente, mas ontem um cliente caiu assim que tentou escrever algo na partição ocfs2 compartilhada.

Eu tentei configurar alguns parâmetros ISCSI para valores mais conservadores, sem sucesso. Somente (v-) mover o cliente para o outro host da VM resolveu o problema. Hoje, mover o outro cliente para o host problemático provoca os mesmos erros:

connection1:0: ping timeout of 5 secs expired, recv timeout 5, last rx 4294971299, last ping 4294966612, now 4294973799
connection1:0: detected conn error (1011)
iscsid: Kernel reported iSCSI connection 1:0 error (1011 - ISCSI_ERR_CONN_FAILED: iSCSI connection failed) state (3)
kernel: [  328.558970]  connection1:0: detected conn error (1020)
iscsid: connection1:0 is operational after recovery (1 attempts)
[repeat until hard reset]

Parece estar relacionado ao host da VM, que tem exatamente a mesma configuração que o outro. Sendo blades, eles usam o mesmo hardware de rede, uma interconexão flex-10.

Alguém tem alguma ideia de como isso poderia estar relacionado? Eu gostaria de encontrar a causa, já que ambos os hosts da VM poderiam ter o mesmo problema (vou ter que mudar para discos em rede, então, parece mais estável, menos propenso a reinicializações).

    
por Berzemus 20.02.2014 / 11:12

1 resposta

0

Este erro está relacionado ao tempo limite de gravação de mensagens. Há pessoas que recomendam usar o vlan para obter melhor taxa de transferência para transferir os dados. Portanto, o problema envolve aqui: host: pilha de IP, adaptador, comutador de rede, adaptador de rede da NetApp, etc.

Outra coisa que você pode fazer é aumentar o tempo limite de gravação no disco.

echo 180 > /sys/block/sdX/device/timeout

Na configuração do iniciador iscsi, usei config:

node.session.iscsi.InitialR2T = No

e esses parâmetros aumentarão os logs iscsi. Use apenas o que for necessário:

# echo 1 > /sys/module/libiscsi/parameters/debug_libiscsi_session 
# echo 1 > /sys/module/libiscsi/parameters/debug_libiscsi_eh
# echo 1 > /sys/module/libiscsi/parameters/debug_libiscsi_conn
# echo 1 > /sys/module/libiscsi_tcp/parameters/debug_libiscsi_tcp
# echo 1 > /sys/module/iscsi_tcp/parameters/debug_iscsi_tcp
    
por 02.07.2015 / 19:35