A latência do disco está crescendo desde alguns dias atrás, sem nenhuma alteração especial na taxa de transferência do disco

7

Aqui está o gráfico de latência de disco do meu servidor. O servidor tem dois discos rígidos 5400 RPM de 32MB de cache SATA 3.0Gb / s montados com a configuração do software RAID 1. Nenhuma mudança especial aconteceu nesses dias e, como você pode ver no próximo gráfico, o IO mostra flutuações normais. (O primeiro pico é causado por um milho semanal)

Atende 130.000 visitantes únicos por dia, com mais de 2 milhões de exibições de páginas / dia, a maioria deles veiculada pelo memcache.

Não consigo descobrir o que causa o problema.

    
por Reza Mohammadi 25.07.2012 / 18:24

2 respostas

9

Pode haver várias coisas em ação aqui.

1) Sua carga de IO está aumentando. O que não é mostrado em seus gráficos ou informações fornecidas é como é sua carga de I / O. Seu sistema está gastando mais tempo em IO? As profundidades das suas filas de leitura / gravação estão mudando? Se este é o caso, então eu sugiro que 5400 unidades RPM podem ser muito lentas para suas necessidades. Quanto mais lenta a velocidade do fuso (RPMs), mais tempo leva para a cabeça de leitura localizar um pedaço de dados.

1a) Fragmentação de dados
Isso depende muito das características de carga do IO, mas é possível que o sistema de arquivos tenha se tornado altamente fragmentado, o que significa que demora mais para ler grandes blocos de dados.

2) Trocando o espaço O que está acontecendo com a memória do seu sistema? O sistema está ficando sem memória e agora precisa espionar o arquivo de troca? Se esse for o caso, o sistema em geral provavelmente exibirá lentidão. De qualquer maneira, verifique sua tabela de processos.

3) Possível falha iminente de disco
É possível que você tenha um disco que está começando a falhar. Eu sugiro que você instale as ferramentas de smartmon e dê uma olhada nos dados SMART usando o utilitário smartctl.

    
por 25.07.2012 / 23:33
3

A resposta do @Red Tux faz sentido. não pode responder com precisão, sem mais alguns detalhes:

  1. o que o servidor está fazendo? é DB ou servidor de arquivos ou servidor web / aplicativo?
    • DB, em seguida, procure por 1a)
    • web / app, em seguida, procure 2)
    • servidor de arquivos, em seguida, procure por 3)
  2. O relatório vmstat e iostat ajudará. correr com atraso de 5 ~ 10s durante a espiada por 1min e enviar.
por 26.07.2012 / 15:15