PCIe: Por que o pciehp fornece informações de log contraditórias

2

Estou executando trabalhos de linha em meu SSD NVMe e o plug-in hotplug. A plataforma é hot-pluggable e o sistema é o Centos 7.0. Vários segundos após o meu plug-out, o sistema encontra uma falha e fornece estas informações de impressão:

================

[1026.468414] {1} [Erro de hardware]: Erro de hardware da fonte de erro de hardware genérico APEI: 1

[1026.468422] pciehp 0000: 5d: 02.0: pcie04: Cartão presente no Slot (6-1)

[1026.468432] pciehp 0000: 5d: 02.0: pcie04: slot (6-1): evento Link Down

[1026.468451] pciehp 0000: 5d: 02.0: pcie04: evento Link Down enfileirado no slot (6-1): atualmente sendo ligado

[1026.468457] pciehp 0000: 5d: 02.0: pcie04: Já habilitado no slot (7-1)

[1026.468705] {1} [Erro de hardware]: gravidade do evento: fatal

[1026.468744] {1} [Erro de hardware]: erro 0, tipo: fatal

[1026.468782] {1} [Erro de hardware]: section_type: erro PCIe

[1026.468825] {1} [Erro de hardware]: port_type: 0, ponto final PCIe

[1026.468867] {1} [Erro de hardware]: versão: 3.0

[1026.468915] {1} [Erro de hardware]: comando: 0x0102, status: 0x4010

[1026.468961] {1} [Erro de hardware]: device_id: 0000: 00: 00.0

[1026.469901] {1} [Erro de Hardware]: slot: 0

[1026.469032] {1} [Erro de hardware]: secondary_bus: 0x00

[1026.469070] {1} [Erro de hardware]: vendor_id: 0x1ded, device_id: 0x3010

[1026.469117] {1} [Erro de hardware]: class_code: 008001

[1026.469155] Kernel panic - não está sendo sincronizado: erro de hardware fatal!

================

A possível causa raiz da falha do sistema é que o par de eventos contraditório que "card present" e "link down" atrapalhou a lógica do sistema. Então, o que me confunde é que o pciehp reporta tanto "card present" quanto "link down" ao mesmo tempo. Como minha experiência, "card present" frequentemente vem com "link up" e "link down" normalmente passa por "card not present".

Alguém poderia me dar algumas dicas sobre como essa estranha situação acontece? Ou qual bit no registrador PCIe aciona o evento "card present" e o evento "link down"?

    
por Leo Erzhuo Chen 07.11.2018 / 04:25

0 respostas