O que uma falha de RAM pode provocar em um cluster de unidades de computação?

1

Estou interessado em algumas dicas técnicas sobre como uma falha em uma RAM é compartilhada entre várias unidades de computação (isso poderia ser máquinas virtuais gerenciadas pelo hipervisor ou dois (ou mais) sistemas operacionais sendo executados em duas (ou mais) computações fisicamente diferentes unidades que compartilham a mesma RAM) podem afetar o comportamento das funções que são executadas nessas diferentes unidades de computação.

Mais precisamente, quais são os possíveis erros que podem ser provocados por uma falha de RAM quando a RAM é compartilhada entre vários sistemas? Pode este fracasso ser undected?

    
por Ecterion 13.04.2018 / 11:30

1 resposta

2

Resposta curta: qualquer coisa.

Se a memória é compartilhada ou não, a corrupção de memória trash seus dados (ou até mesmo o código) e torna o resultado completamente inútil. Quando o código é atingido, é provável que o aplicativo se desvie e possa até mesmo destruir mais dados. No mínimo, vai falhar mais ou menos graciosamente.

Para evitar isso, convém consultar a memória ECC .

    
por 13.04.2018 / 12:58