Como o hardware com falha causa uma falha na página do kernel (armadilha fatal 12)?

3

Eu experimentei uma falha na página do kernel (armadilha fatal 12) no meu servidor FreeBSD 10.3-RELEASE. Eles ocorrem em qualquer lugar, desde milissegundos de tempo de atividade até dias de tempo de atividade. O processo atual é sempre diferente (pagedaemon, pkg, find).

Após ler on-line, a resposta parece apontar para um hardware com falha. Minha pergunta é como exatamente o hardware com falha se manifesta em uma falha de página no nível do kernel? Por que a falha do hardware não resulta em um pânico do Kernel com mais informações descritivas?

    
por mroselli 29.12.2016 / 08:57

1 resposta

0

Um kernel panic é um erro detectado por software ou algum trap de hardware que foi gerado e detectado pelo kernel como estando no código do kernel. A única coisa segura para o kernel fazer é pânico (ou seja, parar voluntariamente). Isso pode ser causado por memória defeituosa, o que faz com que o kernel execute conteúdos de memória inválidos como código ou memória defeituosa, o que faz com que o kernel obtenha dados incorretos, o que causa algum erro ou inconsistência detectada.

Uma falha na página do nível do kernel também é causada por dados ruins do kernel; o kernel tenta acessar uma página que não existe, provavelmente porque está usando um endereço incorreto que foi buscado da memória. Nesse caso, todo o kernel sabe que ele usou um endereço incorreto; pode-se rastrear o código de volta com um depurador para obter pistas de como isso começou, mas você não voltaria muito antes de encontrar várias causas.

O resultado é que tudo que você pode fazer se tiver falhas na página do nível do kernel é testar o hardware!

    
por 09.07.2017 / 01:21