O Windows 2008 R2 virtualizado lança BSOD aleatório, mas não escreve minidumps

2

Estamos passando por BSODs aleatórios dentro de um servidor RemoteDesktop hospedado pelo VMware. As BSODs acontecem quase semanalmente. O curioso é que a máquina virtual não grava nenhum dump que possamos analisar, nenhum minidumps em% systemroot% \ minidump e nenhum dump completo. A única dica que o servidor nos fornece é uma entrada dentro de seu log de eventos, dizendo que ele teve que ser reinicializado devido a um erro crítico. Os detalhes dessa entrada de log mostram um BugCheckCode 252 / 0xFC, que é ATTEMPTED_EXECUTE_OF_NOEXECUTE_MEMORY .

Problemas do MSDN para analisar a despeja e procure o driver com falha armazenado em KiBugCheckDriver . Como não há dumps escritos, obviamente não temos essa opção disponível.

O servidor com falha é um Windows 2008 R2 hospedado no VMware ESXi 5.5.0. As funções instaladas e configuradas são RemoteDesktopServer, FileServer, Print e Webserver. Outras máquinas virtuais em execução no mesmo host não parecem afetadas por esse problema.

Aqui está a saída que recebemos dos detalhes dos eventos:

BugcheckCode 252 
BugcheckParameter1 0xfffff88001e64fb8 
BugcheckParameter2 0x800000000293e963 
BugcheckParameter3 0xfffff88015c55eb0 
BugcheckParameter4 0x2 
SleepInProgress false 
PowerButtonTimestamp 0 

O que tentamos até agora:

  • Desativar a reinicialização automática nas configurações do sistema. Só podemos fazer isso depois que nossos clientes terminarem porque é um dos servidores mais produtivos com os quais estão trabalhando. Desativamos a reinicialização automática para todos os cenários de teste a seguir:
    • Nós caímos na máquina virtual de propósito, usando o NotMyFault da Sysinternals: BSODs aconteceram e pareceram bem "normais" para nós. BSOD disse que tinha terminado de despejar informações em disco, mas como nas BSODs aleatórias que nossos clientes experimentam, não havia absolutamente nenhum dumps escritos
    • Tentamos definir o tamanho do pagefile.sys manualmente para tamanhos diferentes (até 2 vezes RAM), mesmo resultado

Algumas das entradas do EventLog parecem não ter informações valiosas:

BugCheckCode 0
BugcheckParameter1 0x0 
BugcheckParameter2 0x0 
BugcheckParameter3 0x0 
BugcheckParameter4 0x0 
SleepInProgress false 
PowerButtonTimestamp 0 

Para encurtar a história, a principal questão seria por que não há absolutamente nenhum dump escrito no disco. A análise do BSOD / dump em si deve ser a abordagem mais voltada para esse erro.

Se eu puder fornecer mais informações ou esquecer algo, basta perguntar:)

    
por HannesS 04.02.2015 / 10:07

1 resposta

2

Se você estiver usando CPUs Intel E5, verifique este artigo da base de conhecimento: link

Symptoms

When running a virtual machine with Windows 2008 R2, Red Hat Enterprise Linux or Solaris 10 64-bit, you may experience one of these symptoms: •Windows 2008 R2 blue screen events:

0x0000000a - IRQL_NOT_LESS_OR_EQUAL 0x0000001a - MEMORY_MANAGEMENT 0x000000fc - ATTEMPTED_EXECUTE_OF_NOEXECUTE_MEMORY

Cause

At the time of publication (September 10, 2014), these processors are identified as being affected: •Processors named as Intel® Xeon® Processor E5-#### v2, where #### is a 4-digit number, optionally followed by a letter. •Processors named as Intel® Xeon® Processor E7-#### v2, where #### is a 4-digit number. •Processors named as Intel® Xeon® Processor E3-12## v2, where ## is a 2-digit number optionally followed by a letter.

Resolution

This is a known issue affecting VMware ESXi. Contact your vendor for an updated BIOS for your hardware to resolve this issue and provide reference to the relevant Intel Errata: •CA135 - A MOV to CR3 When EPT is Enabled May Lead to an Unexpected Page Fault or an Incorrect Page Translation in the Errata section of the Intel Xeon Processor E5 v2 Product Family document. •CF124 - Incorrect Page Translation when EPT is enabled in the Errata section of the Intel Xeon Processor E7 v2 Product Family document.

Note: The preceding links were correct as of July 11, 2014. If you find a link is broken, provide feedback and a VMware employee will update the link.

If there is no BIOS update available for your platform, use one of the following to fix this issue:

Upgrades: This issue is resolved in ESXi 5.5 Update 2, available at VMware Downloads. For more information, see VMware ESXi 5.5 Update 2 Release Notes.

Currently, there is no resolution for ESXi 5.1 hosts.

Se você estiver usando essas CPUs, sugiro que você atualize o BIOS de seus hosts ou atualize o ESXi para a Atualização 5.5 da versão 5.5.

    
por 10.02.2015 / 15:55