Isso parece ser um problema de memória. Boot memtest e verifique seu ram.
Eu tenho um monte de trabalhos com I / O, e para aumentar o desempenho, acabei de instalar dois SSDs em um servidor de computação, um como um sistema de arquivos de rascunho, um como swap. Após a execução por algum tempo, todos os meus processos ficam no estado "D", não consomem CPU eo sistema informa 67% de inatividade e 33% espera. Um iostat mostra a atividade do disco no , e o sistema é de outra forma responsivo, incluindo os sistemas de arquivos relevantes. Anexar uma 'strace' aos processos não produz saída.
Olhando em / proc / (pid) / fd, descubro que todos os processos estão usando (lendo) um arquivo comum. Não vejo nenhum motivo para isso causar problemas, mas substituí o arquivo, eliminei os processos e deixei tudo continuar (ou seja, novos processos serão iniciados). Vamos ver se as coisas ficam presas no novo arquivo, em um arquivo diferente, ou - idealmente - não em todos: -)
Também encontrei alguns deles em kern.log:
BUG: unable to handle kernel paging request at ffffeb8800096e5c
Muitas outras informações, mas não sei como decifrá-lo - exceto que se refere ao PID e ao nome de um dos meus processos.
Alguma ideia do que está acontecendo aqui ou como consertar isso? Isso é no Ubuntu 12.04 LTS, caixa Dell-something com um controlador de disco RocketRaid e sistema de arquivos btrfs.
Isso parece ser um problema de memória. Boot memtest e verifique seu ram.