Ferramentas para solução de problemas de gargalos de desempenho da SAN

5

Quais são as melhores ferramentas para solucionar problemas de gargalos de desempenho de SAN?

    
por Registered User 02.06.2009 / 21:30

9 respostas

6

Depende muito do hardware com o qual você está jogando. Gargalos podem vir de uma variedade de fontes:

  • Afunilamentos baseados em host Às vezes, um servidor simplesmente não pode remover blocos de E / S com rapidez suficiente. Para isso, você precisará usar as métricas de desempenho que seu sistema operacional (ou aplicativo) precisa diagnosticar.
  • Gargalos com base em tecido Os comutadores Brocade têm métricas de desempenho em gráficos úteis, bem como números reais. A seguir, podemos esclarecer onde você está se deparando com problemas, talvez com ISLs saturados. SMI-S deve ajudá-lo aqui, se você tiver a capacidade de usá-lo.
  • Afunilamentos de matriz Eles podem ter vários tipos de controle, como controladores saturados, grupos de discos sobrecarregados e afins. Como os switches, os arrays mais recentes devem suportar o SMI-S para rastrear as coisas.
por 02.06.2009 / 21:39
2

Lamentamos, mas a ferramenta PAL (Análise de desempenho de logs) - link é útil para identificar problemas com configurações de SAN, embora você possa ter que puxar um período de tempo bastante longo de logs de contador de desempenho .blg. Espero que isso ajude.

    
por 02.06.2009 / 22:06
2

Sua escolha de ferramenta depende da sua plataforma de hardware. Em qualquer caso, os afunilamentos se manifestarão em um dos três pontos da sua arquitetura:

  1. Anfitrião
  2. Switch Fabric
  3. Matriz de armazenamento

Você precisará de uma ferramenta (ou ferramentas) que tenha a capacidade de monitorar cada um desses componentes. Você pode querer adotar a melhor estratégia de raça e usar 3 ferramentas diferentes ou você pode preferir uma abordagem do Senhor dos Anéis e selecionar uma única ferramenta "para governar todas elas". Tudo o que funciona para você. Comece contatando seu (s) fornecedor (es) e veja quais ferramentas estão disponíveis para seus dispositivos. Você deve poder começar a coletar métricas em cada um desses pontos em sua cadeia de E / S, o que permitirá identificar onde você precisa concentrar seu esforço.

    
por 03.06.2009 / 23:05
2

Monitore o tamanho da fila de disco nos servidores:

  • perfmon / scom no Windows
  • sar no unix
  • Virtual Center / esxtop no VMware
por 09.06.2009 / 23:03
1

Se você quiser uma solução de empresa privada, dê uma olhada no TPC for Disk / Fabric da IBM. Você pode monitorar qualquer componente de sua SAN (que suporta SMI-S, bem como outros padrões) a partir de uma interface e ser capaz de visualizar ou consultar dados históricos.

Se isso não for uma opção, você pode consultar os vários dispositivos SAN para suas estatísticas e configurar algum tipo de monitoramento de RRD para representar graficamente o desempenho e identificar os gargalos.

A maioria dos subsistemas e switches de disco tem algum tipo de monitoramento de desempenho embutido na forma de gráficos ao vivo - tente ver também isso.

(aviso legal: minha empresa vende TPC)

    
por 02.06.2009 / 21:36
1

Você pode usar o Storage Essentials da HP. Eles têm um módulo de desempenho, o software pode analisar do servidor para o SAN. A análise no lado do servidor funciona apenas com o servidor HP, eu acho.

    
por 02.06.2009 / 22:47
1

Boa pergunta,

Para as principais plataformas de armazenamento da EMC: o Workload Analyzer funciona para o EMC Symmetrix. Essa ferramenta é muito robusta e faz parte da família EMC ControlCenter. Para os arrays CLARiiON e Celerra, o Navi Analyzer pode fornecer dados de desempenho semelhantes. Esta ferramenta está ativada no nível da matriz. Para SAN Performance, existem ferramentas da Brocade e Cisco que podem ajudar (gerenciador de malha ou Connetrix Manager / DFCM). Além disso, se replicação remota estiver envolvida, ferramentas de rede podem ser necessárias. Sinta-se à vontade para entrar em contato com um Especialista em Vendas da EMC ou Especialista em Serviços da EMC se precisar de orientação detalhada no SAN Space.

    
por 02.06.2009 / 23:12
0

Colete dados. Tudo isso. O tempo todo:)

Para perseguir os afunilamentos, muitas vezes você precisa ver a ocorrência e a latência individuais das trocas (divididas por Initiator, Target, IT ou ITL), e B2Binfo e vincular eventos (LR, C3D) em todos alternar portas em toda a SAN.

Eu trabalho com empresas diferentes a cada dia. Eu tenho a tendência de encontrar situações como um servidor antigo com grandes entradas, grandes trocas, alguns CRCs para enfraquecer um pouco os links e uma carga em rajadas para que a SAN pareça funcionar, exceto nos raros casos em que ela "se apaga". Ao verificar san-wide para indicações de lentidão e "zoom em" os links afetados, verificando se a demanda é excessiva ou uma correlação entre a utilização desse servidor, informações B2B e / ou outros dados, podemos ver alguns dos mais prováveis suspeitos.

Usamos uma ferramenta específica para coletar esses dados e exibi-los, mas, no entanto, você pode coletar latência, demanda e eventos dessas diferentes fontes para você. Eu não quero pular em uma pergunta não respondida de 5 anos de idade com um anúncio. Se você quiser detalhes e soltar nomes, comente.

A chave é que você não saberá quais dados observar até que isso aconteça. Então colecione tudo. Quanto mais você puder pesquisar após o fato, maior a chance de ter uma ideia do que aconteceu e como evitar a recorrência.

    
por 18.04.2014 / 22:37
-3

Geralmente, se houver um problema de desempenho da SAN, a solução real é resolver os problemas políticos que o forçaram a comprar uma SAN difícil de diagnosticar e manter a SAN em primeiro lugar. Substitua a SAN e hospede-a por um HP DL380 G5 com dois controladores com cache de 512 MB e 4 unidades de 146 GB de 15 KPM por controlador em um RAID 1 + 0 (ou talvez um RAID 5 por controlador). Stripe os dois grupos de RAID. Adicione quatro placas SSD FusionIO PCI-E de 320 GB, RAID 1 + 0 em software.

A solução geral é mais rápida que qualquer SAN e oferece mais armazenamento do que a maioria dos sistemas exige.

Você não tem redundância de nível de controlador neste sistema. Compre dois servidores idênticos e espelhe seus bancos de dados em software, ou espelhe entre os dois controladores em software para obter uma solução semelhante (bem, maior) em confiabilidade à SAN.

    
por 03.06.2009 / 07:59