Extremamente lento ao anexar pools de armazenamento iSCSI

0

Então, demos uma olhada no Ubuntu 17.10, apenas para obter uma "prévia" de como o Ubuntu 18.04 poderia se comportar com nosso hardware (sim, eu sei que não é uma comparação confiável) e após problemas de estabilidade significativos, decidimos ir volta para 16.04.3.

(Só para ter uma ideia sobre o Ubuntu 17.10, as VMs estavam perdendo networking, as VMs estavam tendo erros de CPU que eu nunca tinha visto antes, e os servidores estavam sendo redefinidos aleatoriamente no nível do hardware.)

Enquanto no Ubuntu 17.10, nós conseguimos conectar instantaneamente um pool de armazenamento iSCSI ("virsh pool-start iscsi-pool1"). Não houve atraso algum.

Agora, em 16.04.3, são necessários no mínimo 20 segundos até 90 segundos (em média, cerca de 40 a 45 segundos) para conectar um único destino iSCSI. Como temos quase 140 ou mais alvos que se conectam automaticamente na inicialização, isso transforma um tempo de inicialização de 3 a 4 minutos em quase duas horas. Não é ideal em nenhuma circunstância.

Executar os comandos equivalentes do iscsiadm para conectar-se manualmente ao destino iSCSI em 16.04.3 é o mesmo que conectar-se por meio do libvirt em 17.10 - é instantâneo.

Ao executar um comando "watch -n0 'netstat -an | grep 3260'" ao iniciar o storage pool com virsh, notamos que uma conexão é imediatamente feita e fechada, e depois não há mais conexões feitas até que libvirt finalmente estabelece a conexão até 90 segundos depois.

O problema definitivamente parece um problema de libvirt em 16.04.3, visto que o libvirt do Ubuntu 17.10 funciona perfeitamente, assim como o iscsiadm em 16.04.3. E nós realmente reinstalamos o sistema operacional várias vezes para descartar qualquer tipo de erro "quem sabe o que aconteceu".

Esse problema está afetando o hardware da AMD e da Intel em muitas configurações diferentes. Mas, como afirmei anteriormente, funciona 100% perfeitamente (para pools de armazenamento iSCSI) no Ubuntu 17.10.

Alguém mais notou esse comportamento? Alguém tem algum conselho sobre como podemos solucionar isso?

Em outro datacenter, não temos quase tantos alvos iSCSI, e no Ubuntu 16.04.3, o desempenho parece ser aceitável. Não é tão rápido quanto 17.10, mas é apenas 4 ou 5 segundos, em vez de 20 segundos no mínimo.

Quer dizer, este não é um problema de final de jogo. Mas isso realmente torna o gerenciamento desses servidores bastante difícil. Não sei onde começar a solucionar o problema.

Muito obrigado antecipadamente a qualquer ajuda! ~ Laz

    
por paravis 18.12.2017 / 01:27

0 respostas