Na minha experiência com os sintomas que você está descrevendo, é necessário solucionar o código, não o ambiente do servidor. Supondo que o seu servidor esteja saudável, é claro - e se você não estiver vendo nada no visualizador de eventos e monitor de desempenho, provavelmente é.
No front-end, coloque alguns testes de carga juntos e veja se você pode encontrar uma semelhança nas falhas. Do backend, comece a colocar algum registro / rastreamento.