O que é uma ferramenta de teste de estresse confiável para o Dell R820 executando o VMware ESXi? [fechadas]

1

Temos um Dell PowerEdge R820 executando o VMware ESXi que teve vários erros de CPU nos últimos dois meses. Ele estava originalmente tendo um IERR na CPU1 e agora está mostrando erros de Verificação da CPU para CPU3. Eu troquei CPU3 - > CPU2 e CPU1 - > CPU4 para ver se os erros seguiriam os processadores. Após a troca, o servidor ficou ligado por cerca de 72 horas antes de eu executar outro DSET e não houve mais erros de hardware. Eu quero executar um teste de estresse nas CPUs e na memória por cerca de 24 horas para verificar se ele será capaz de lidar com a carga quando entrarmos em produção. É possível que as CPUs tenham sido transferidas durante o envio (logo antes de começarmos a receber os primeiros erros).

O problema é que não conheço nenhuma ferramenta de teste de estresse para minha configuração específica. Eu tentei usar o breakin mas ele não inicializa corretamente. (Fica pendurado no 'carregamento sb_edac'). Existe uma ferramenta que você pode recomendar eu uso para teste de estresse um R820 (Intel Xeon e5-4600) executando o VMware ESXi?

    
por Robert Ray 17.09.2013 / 15:37

1 resposta

0

Neste caso, você pode apenas carregar um CD live ou CD de resgate Linux contendo a ferramenta stress (prefiro o disco PLD Linux ) e deixar o servidor em um loop.

No entanto, gostaria de me apoiar strongmente no suporte da Dell e substituir a placa-mãe / CPUs e / ou RAM. O servidor não está saudável! A depuração desse tipo de coisa pode não ser eficiente no tempo.

Você capturou o despejo do sistema ESXi? Logs de suporte?

    
por 17.09.2013 / 15:44