o sistema de arquivos raiz é montado como somente leitura após algum tempo

3

Meu sistema de arquivos raiz ( / ) é remontado como somente leitura após o sistema estar ativo por algum tempo. Isso parece variar de 3 horas a 48 horas. Este sistema está executando o Ubuntu desktop 14.04. Sua função principal é executar várias máquinas virtuais para mim. Aqui está a configuração do sistema.

  • Dell XPS 8700
  • Intel i7 4770 24 GB ram
  • SSD mSATA de 128 GB (segure o / sistema de arquivos que tem me dado problemas. Também contém swap e outros sistemas de arquivos do sistema)
  • Unidade SATA de 3 TB a 1 TB (não há problema aqui) Mas eles armazenam os arquivos da VM. este atualmente só executa 3 VMs.

Um sistema semelhante (HP) tem 32 GB de RAM, mas a mesma configuração não tem esse problema. Ele executa 12 VMs sem prob.

Depois que / remontar como somente leitura, as VMs morrem quando gravam em um local temporário no SSD. Não consigo sudo na máquina. E se eu tentar executar o terminal de terminal "mount" de comando apenas fecha. Depois de uma reinicialização, me pedem para corrigir o erro do sistema de arquivos (na inicialização), o que eu faço e isso funciona bem até o próximo incidente.

Eu tenho backups das VMs (além de suas unidades parecem estar bem). Mas eu prefiro corrigir esta instalação do que refazê-lo desde que eu fiz alterações que personalizam o sistema ao meu gosto. Greping dmesg para EXT4-fs mostra isso, mas acho que isso é apenas inicialização. Nenhum erro.

[    1.331446] EXT4-fs (sde1): mounted filesystem with ordered data mode. Opts: (null)
[    2.474298] EXT4-fs (sde1): re-mounted. Opts: errors=remount-ro
[    2.584750] EXT4-fs (sda): mounted filesystem with ordered data mode. Opts: (null)
[    2.637858] EXT4-fs (sdc): mounted filesystem with ordered data mode. Opts: (null)
[    2.768738] EXT4-fs (sdd1): mounted filesystem with ordered data mode. Opts: (null)
[    2.850718] EXT4-fs (sdb1): mounted filesystem with ordered data mode. Opts: (null)

Eu executei um teste inteligente em Discos. Mas diz que tudo está bem aí. (E a máquina tem apenas 3 meses de idade. Esse problema tem sido proeminente por cerca de 3 semanas agora.

Estou aberto a ideias.

EDIT 1: Ele caiu na noite passada. Então eu fiz algumas escavações. charles @ VMH2: / var / log $ cat /var/log/syslog.1 | grep sde1
18 de julho 19:19:40 kernel VMH2: [0.892391] sde: sde1 sde2 & lt; sde5 & gt;
18 de julho 19:19:40 kernel VMH2: [1.331446] EXT4-fs (sde1): sistema de arquivos montado com modo de dados ordenados. Opts: (nulo)
18 de julho 19:19:40 kernel VMH2: [2.474298] EXT4-fs (sde1): re-montado. Opts: errors = remount-ro
Jul 19 04:49:13 kernel VMH2: [27950.072962] INFO: tarefa jbd2 / sde1-8: 212 bloqueada por mais de 120 segundos.
Jul 19 04:49:13 kernel VMH2: [27950.072968] jbd2 / sde1-8 D ffff88061ecd30c0 0 212 2 0x00000000
Jul 19 11:48:50 kernel VMH2: [0,888753] sde: sde1 sde2 & lt; sde5 & gt;
Jul 19 11:48:50 kernel VMH2: [0.961088] EXT4-fs (sde1): sistema de arquivos montado com modo de dados ordenados. Opts: (nulo)
19 de julho 11:48:50 kernel VMH2: [1.999033] EXT4-fs (sde1): re-montado. Opts: errors = remount-ro charles @ VMH2: / var / log $ cat /var/log/syslog.1 | grep 27950
Jul 19 04:49:13 kernel VMH2: [27950.072962] INFO: tarefa jbd2 / sde1-8: 212 bloqueada por mais de 120 segundos.
Jul 19 04:49:13 kernel VMH2: [27950.072966] Tainted: P OE 3.16.0-43-genérico # 58 ~ 14.04.1-Ubuntu
Jul 19 04:49:13 kernel VMH2: [27950.072967] "echo 0 & gt; / proc / sys / kernel / hung_task_timeout_secs" desativa esta mensagem.
Jul 19 04:49:13 kernel VMH2: [27950.072968] jbd2 / sde1-8 D ffff88061ecd30c0 0 212 2 0x00000000
Jul 19 04:49:13 kernel VMH2: [27950.072971] ffff8805f8297cb0 0000000000000046 ffff8805f8218a30 ffff8805f8297fd8
Jul 19 04:49:13 kernel VMH2: [27950.072973] 00000000000130c0 00000000000130c0 ffff8802e8570000 ffff8805f8297d98
Jul 19 04:49:13 núcleo VMH2: [27950.072975] ffff8805f89160b8 ffff8805f8218a30 ffff8805dc2c9e00 ffff8805f8297d80
Jul 19 04:49:13 VMH2 kernel: [27950.072977] Rastreamento de chamadas:

Parece-me que INFO: tarefa jbd2 / sde1-8: 212 bloqueada por mais de 120 segundos. é a fonte dos meus problemas. Eu só não sei o que a mensagem significa (ou qualquer coisa depois disso). Alguém sabe o que está acontecendo aqui?

    
por Charles Beckler 19.07.2015 / 04:33

0 respostas