Pânico com kernel aleatório após a reinstalação do Arch Linux

0

Recentemente, tive dois discos rígidos que falharam em um array RAID 5, não configurei nenhum monitoramento, então não percebi que um deles havia sido danificado por um tempo. Então decidi desfazer tudo e começar do zero.

Todo o hardware é o mesmo de antes, exceto que eu tenho menos unidades do que antes em minha matriz, 3 maiores em vez de 8. Também instalei o Arch Linux como UEFI em vez de usar a opção de inicialização herdada, não tenho certeza que afeta qualquer coisa.

Eu re-instalei o Arch Linux, com monitoramento / notificações mdadm apropriados e testes SMART curtos diários (e testes longos semanais).

No entanto, desde a reinstalação do Arch Linux, tenho visto pânico aleatório no kernel, geralmente após mais de 48 horas de atividade.

Eu consegui tirar uma foto do pânico do kernel:

Agora,peloqueconsigover,pareceestarrelacionadocomomdadm.

Aquiestáminhaconfiguraçãodomdadm:

Personalities:[raid1][raid6][raid5][raid4]md0:activeraid1sda1[0]sdb1[1]524224blockssuper1.0[2/2][UU]md1:activeraid1sda3[0]sdb3[1]1950761024blockssuper1.2[2/2][UU]bitmap:5/15pages[20KB],65536KBchunkmd2:activeraid5sde1[3]sdc1[0]sdd1[1]5796265984blockssuper1.2level5,512kchunk,algorithm2[3/3][UUU]bitmap:0/22pages[0KB],65536KBchunkunuseddevices:<none>

Linharelevantenomkinitcpio.conf:

HOOKS="base udev autodetect modconf block mdadm_udev filesystems keyboard fsck"

Eu estou atualmente no Linux akatosh 4.1.6-1-ARCH # 1 SMP PREEMITO seg 17 de agosto 08:52:28 CEST 2015 x86_64 GNU / Linux.

Eu tentei recolocar minha memória RAM, mas duvido que seja um problema de RAM, pois isso não estava acontecendo antes de eu ter reinstalado o Arch Linux.

A maioria dos problemas de kernel panic relacionados ao mdadm que eu encontrei na minha pesquisa estavam ocorrendo na inicialização. Alguém tem uma pista sobre qual poderia ser o problema?

EDITAR: Parece que este é um bug conhecido introduzido em 4.1.4 ou 4.1.5: link

Vou tentar atualizar para o 4.2.0 no teste e atualizarei este post com mais informações.

    
por jValdron 15.09.2015 / 17:13

1 resposta

1

Este é um bug conhecido que foi introduzido com:

edbe83ab4c27 md/raid5: allow the stripe_cache to grow and shrink.

Mais informações podem ser encontradas neste relatório de bug oficial, “Bug 1255509 - BUG: não é possível lidar com o kernel pedido de paginação em ffffffffffffffd8. ”

A solução é atualizar para o 4.2.0.

    
por 17.09.2015 / 19:13