MongoDB 100% bloqueado periodicamente. Gráficos MMS anexados

2

Tentando diagnosticar o que pode estar causando o travamento intermitente no servidor MongoDB em execução por trás de um aplicativo Rails. Esperando que alguém possa reconhecer o padrão de altos e baixos nos gráficos que podem ser caracterizados da seguinte forma:

  • opcounter - caiu para 20% (comparado ao nível típico)
  • btree - diminuída por quantidade semelhante
  • lock% - aumentou de cerca de 10% da média para eventualmente saturar a 100%
  • conexões - aumentaram ligeiramente durante o evento
  • filas - grande pico nos leitores, mas também um único escritor no meio do evento
  • cursores
  • - pico distinto em cursores de 5 a 12 durante o evento
  • rede - redução acentuada na E / S de rede para cerca de 30% do nível de pré-evento
  • falhas de página - aumento notável de cada lado do evento com redução durante o evento
  • E / S de disco do servidor foi normal durante o evento

A configuração é de 1 servidor principal e 3 servidores secundários executados em VMs rackspace. Todos têm 16 GB de RAM (acima de 8 GB recentemente) com cerca de 19 GB de dados totais e tamanho de índice. Recentemente atualizado para o 2.4.10.

Não está usando sharding no momento.

Gráficos disponíveis para visualização aqui: link (desculpe, não é permitido postar imagens inline ainda ...)

A criação de perfil está ativada, mas não mostra nenhuma consulta lenta relevante. Temos muitas informações de registro disponíveis (MMS, New Relic, registros de aplicativos, mongostat), mas gostaríamos de algumas indicações de onde procurar primeiro para acelerar a resolução.

    
por craig1410 11.04.2014 / 14:06

1 resposta

0

Você viu se está atingindo o limite de arquivos abertos? Eu já encontrei isso antes e tive que aumentar esse valor para ajudar a aliviar o problema. Eu também vi isso quando a chave shard escolhida não está espalhando os registros como muito bem, se você estiver sharding.

    
por 11.04.2014 / 23:01