Isso realmente parece um problema com a placa-mãe do seu servidor.
Podemos ver na sua saída dmesg
que ele não está se comunicando corretamente com a placa PCIe no servidor com falha, mas funciona corretamente em um servidor diferente.
Então você provavelmente tem um slot PCIe ruim ou componentes ruins da placa-mãe.
Você pode tentar usar um slot PCIe diferente, se tiver outro disponível, verificando se a NIC e a placa riser (se houver) estão bem encaixadas ou substituindo a placa riser ou a placa-mãe.
Também pode ser, se você não tentou essa NIC específica em um servidor diferente e funcionou, que a NIC em si é ruim.