Web Server falhando devido a erros de memória. É como um relógio

1

Eu tenho um servidor IIS que está falhando às 3:15 da manhã toda sexta-feira e sábado. Eu entendo que trocar DIMM A no Banco 1 provavelmente resolveria o problema. Mas eu gostaria de resolver o problema antes de fazermos isso. Mas a substituição da RAM está agendada.

Abaixo está um resumo do que acontece.

3:14:35 am
    SceCli (Informational)
        Security policy in the Group policy objects has been applied successfully

3:15:19 am
    Desktop Window Manager (Informational)
        The Desktop Window Manager has exited with code (0x40010004)

3:15:19 am
    User Profile Service (Warning)
        Windows detected your registry file is still in use by other applicatiion or
        services. The file will be unloaded now. The applications or services that hold 
        your registry file may not function properly afterwards.  

        DETAIL – 1 user registry handles leaked from \Registry\User\S-1-5-XX-
        2507511830-2134150133-3242518477-XXX:

        Process 148 (\Device\HarddiskVolume2\Windows\System32\svchost.exe) has opened 
        key \REGISTRY\USER\S-1-5-XX-2507511830-2134150133-3242518477-
        XXX\Printers\DevModePerUser

3:15:22 am
    User Profile Service (Warning)
        Windows detected your registry file is still in use by other applications or 
        services. The file will be unloaded now. The applications or services that hold 
        your registry file may not function properly afterwards.  

        DETAIL -  2 user registry handles leaked from \Registry\User\S-1-5-XX-
        3491755899-3753403084-3723671508-YYYY:

        Process 4196 (\Device\HarddiskVolume2\Windows\System32\wbem\WmiPrvSE.exe) has 
        opened key \REGISTRY\USER\S-1-5-XX-3491755899-3753403084-3723671508-
        YYYY\Software\Microsoft\Windows\CurrentVersion\Internet Settings

        Process 4196 (\Device\HarddiskVolume2\Windows\System32\wbem\WmiPrvSE.exe) has 
        opened key \REGISTRY\USER\S-1-5-XX-3491755899-3753403084-3723671508-
        YYYY\Software\Policies\Microsoft\Windows\CurrentVersion\Internet Settings

3:15:29 am
    User Profile Service (Informational)
        The User Profile Service has stopped.

3:16:43 am to 3:16:44 am
    SERVER FAULT (Critical) 
        ECC Error Correction detected on Bank 1 DIMM A
        ECC Error Correction detected on Bank 1 DIMM A
        ECC Error Correction detected on Bank 1 DIMM A
        ECC Error Correction detected on Bank 1 DIMM A
        ECC Error Correction detected on Bank 1 DIMM A

3:18:07 am
    User Profile Service (Informational)
        The user profile service has started successfully.

Qualquer ideia é muito apreciada.

    
por Oxymoron 22.12.2012 / 08:41

2 respostas

1

Você identificou que o hardware defeituoso está causando problemas no seu servidor. Você arranjou para consertar isso. Qual solução você está procurando nesse meio tempo?

Suponho que você possa remover esse DIMM, contanto que a memória restante seja uma configuração suportada para o seu hardware.

    
por 22.12.2012 / 21:09
2

A substituição do DIMM A em Back 1 foi a solução para este problema. Também consegui reproduzir o problema em um servidor separado usando o mesmo DIMM em questão.

    
por 17.02.2013 / 23:06