A primeira coisa a ter em mente ao combinar esses arrays EQL em um único pool é que a carga de trabalho em cada volume tem o potencial de afetar o desempenho em outros volumes. É possível que seu banco de dados SQL - embora resida em mais eixos físicos agora - tenha mais contenção de recursos devido a outras cargas de trabalho que compartilham os mesmos eixos.
O segundo fator principal que vem à mente é a rede de armazenamento. Com membros em pools ou grupos separados, quase todo o seu tráfego de rede iSCSI é de E / S para / dos hosts. No entanto, com membros em um único grupo e pool, você deve contabilizar o tráfego dentro do grupo, principalmente o movimento da página. O movimento da página mantém a capacidade em uso, mesmo entre os membros, e também equilibra os dados "quentes" aos membros com cargas de trabalho relativamente baixas. Confira o white paper sobre Equallogic Load Balancers para obter informações mais detalhadas .
Esse aumento no tráfego pode facilmente exceder o que seus switches são capazes, se eles não atenderem aos padrões descritos no Matriz de compatibilidade de armazenamento Dell (consulte a página 19)
Você também pode ler o whitepaper melhores práticas para VMware e Equallogic para garantir que sua configuração não seja a causa do problema.
Algumas perguntas:
-
Você tem uma garantia ativa em algum dos arrays? Nesse caso, isso é realmente algo que você deve obter como contribuição de inúmeros recursos disponíveis para ajudar no desempenho.
I don't have active warranty on any of the arrays unfortunately.
-
Você tem a sede da SAN instalada e monitorando o grupo? Se não ... consiga instalá-lo e configurá-lo (desde que você tenha uma garantia e possa obtê-lo). Ele fornece algumas informações importantes sobre muitas das métricas de desempenho de armazenamento necessárias para entender possíveis causas raiz.
I do have SAN HQ, though... can you elaborate on what I should be looking at within it to help pin this down?
O local mais fácil de verificar é em "análise experimental", que fornece um gráfico da sua carga de trabalho em comparação com um "IOPS máximo estimado". Você pode visualizar isso para todo o grupo e para membros individuais. Você também pode ver a IOPS do fuso individual e a profundidade da fila na seção de hardware, embora possa ser difícil dizer apenas por esses números se os fusos estão sendo sobrecarregados.
- Quantos membros / matrizes você tem no mesmo pool agora?
There are 5 arrays in the same pool now
Eu recomendo strongmente que você considere dividi-los em dois pools, com no máximo 3 membros em um pool. Um volume é distribuído apenas entre três membros quando não está no meio do reequilíbrio da capacidade para um membro diferente (o que acontecerá com frequência em volumes com instantâneos que mudam constantemente de espaço em uso). Cortar as coisas em até 3 membros no máximo irá parar uma grande quantidade de "churn" de fatias de volume inteiras sendo reequilibradas entre os membros em uma perseguição sem fim depois de obter a capacidade de uso o mais igual possível entre os membros.
Fora de toda essa informação ... se você não consegue chegar ao fundo das coisas sozinho, você pode considerar apenas pagar por um tíquete de suporte com a Dell para que alguém passe por tudo no ambiente com você para isolar a causa.