Corrupção de dados na memória detectados: onde está o problema?

1

Estamos enfrentando falhas nos nossos SSD VPS, todos trabalhando no KVM: falhas ocorrem por motivos diferentes; na pressa de restaurar o serviço que minha equipe usa para recarregar um instantâneo anterior da máquina e nunca salva os logs.

De qualquer forma, entre todas as circunstâncias de colisões diferentes, um fato recorrente é o corruption of in-memory data : nosso provedor de VPS nos informou que seu hardware está funcionando bem, mas eu não sei ler o registro ruim que recebi.

Oqueestáenvolvidoquandouma"corrupção de dados na memória" é detectada? Poderia ser por causa de RAM quebrada, ou há outros tipos de corrupção de memória?

Coisa engraçada: um provedor de VPS que usa o VMware nunca nos causou problemas, o que usa o KVM está realmente deixando-nos loucos por causa dessas falhas.

Editar 1 : Eu, de modo algum, exijo que vocês deduzam a solução deste log miserável. Eu estou preso com este problema onde nenhum log decente é fornecido, memtest é inútil desde que o hardware é emulado e o provedor VPS garantiu que seu hardware está bem e nenhuma instância do KVM ou QEMU caiu. corruption of in-memory data detected está me assombrando, e não consigo pensar em nenhuma abordagem produtiva para investigar ainda mais esse problema.

    
por elmazzun 19.02.2018 / 12:29

1 resposta

0

"Corrupção de dados na memória detectada" não significa necessariamente que a RAM do hardware é ruim. Também pode indicar que um bloco foi lido ou escrito incorretamente, o armazenamento foi um pouco ou está falhando, possivelmente erros no sistema de arquivos e algumas outras causas.

A reversão para um instantâneo provavelmente não resolverá o problema se houver alguma corrupção do sistema de arquivos latente; vai aparecer de novo mais tarde.

Em vez disso, você deve xfs_repair do sistema de arquivos, mas como é o sistema de arquivos raiz, você precisará inicializar a partir da mídia de instalação ou um ambiente de resgate fornecido pelo seu provedor de VPS.

Se xfs_repair falhar ao reparar o sistema de arquivos, você poderá executar xfs_repair -L , o que limpará o log XFS (que pode estar corrompido) e tentará reparar o sistema de arquivos novamente.

    
por 19.02.2018 / 18:43