Diagnosticando vazamento de memória do tag “Arquivo” no poolmon.exe em 2008R1SP2

3

Temos um vazamento de memória que assola muitos dos nossos servidores de arquivos 2008R1SP2. A tag de memória não paginada "Arquivo" em poolmon.exe irá vazar até que as pastas compartilhadas não estejam mais disponíveis e, em seguida, o RDP desce com ela (e temos que reinicializar por meio do console). Às vezes, esse vazamento é > 1.5G / dia.

Se algo precisar ser removido, eu preciso ter um bom palpite e um CM enorme precisa ser aprovado. A única mudança desde que isso começou a acontecer foi a adição do McAfee Agent 5.0.2.132, no entanto o AV com o McAfee não foi executado de nenhuma forma (está em preparação para uma migração ainda não implementada). Eu percebo que a tag MFEm na tela poolmon é a McAfee, mas ela não está no topo da lista na maioria dos servidores com vazamento.

Além disso, as tags rastreadas de volta ao driver da NIC (iANS ou BCM8) geralmente são exibidas na parte superior 5-6 na classificação de bytes não paginados. Ainda não tentamos isolar a rede, mas talvez seja uma boa ideia.

A próxima etapa lógica que entendo é executar o xperf / Windows Performance Toolkit, mas isso parece exigir o .NET 4.5, que não podemos instalar por diversos motivos.

1) Alguém sabe de algum lugar para baixar uma versão mais antiga do xperf que é independente, compatível com 2008R1SP1 (mesmo CLI apenas)?

2) Supondo que o número 1 esteja indisponível (ou, na melhor das hipóteses, uma idéia ruim), existe algum outro utilitário que possa rastrear e rastrear tags de pool de maneira semelhante?

3) Você tem alguma sugestão para me apontar na direção certa?

    
por kiwisan 21.10.2015 / 20:26

3 respostas

1

Acabamos pagando por um caso de suporte com a Microsoft. O engenheiro conseguiu rastrear o vazamento para o agente da McAfee. A instalação dos seguintes hotfixes (por Microsoft) resolveu o vazamento do pool não paginado, sem precisar desinstalar o agente McAfee, em nossos servidores do 2008 SP2: KB2029048, KB2961072, KB3019168. Espero que isso ajude alguém que tenha esse problema.

Obrigado a todos aqueles que aproveitaram o tempo para serem úteis.

EDIT: Caso você estivesse curioso, não poderíamos desativar o agente da McAfee durante a solução de problemas devido a motivos políticos. Vários departamentos de TI dentro de uma grande empresa, com interesses sobrepostos e alguns egos delicados. Agora, a evidência fala por si mesma pelo menos. ; -)

    
por 25.11.2015 / 20:22
1

Talvez não seja uma resposta direta, mas como vi seu "meta-arquivo" muito alto, há uma solução particular para isso.

Você enfrenta problemas de desempenho em aplicativos e serviços quando o cache de arquivos do sistema consome a maior parte da RAM física - link

Explicado: link

    
por 21.10.2015 / 20:57
0

Um cache Meta alto + uso de "Arquivo" indica que os programas executam muitas operações do FileIO. Você tem que usar xperf para rastrear o que causa o uso . Instale o WPT do Windows SDK (a versão 8.1 também funciona no Win7 / 2008R2, mas não no antigo Server 2008) (Aqui está o MSI installer se você não quiser instalar o .Net Framework 4.5), abra um cmd.exe como admin e execute isto:

xperf -on PROC_THREAD+LOADER+POOL -stackwalk PoolAlloc+PoolFree+PoolAllocSession+PoolFreeSession -BufferSize 2048 -MaxFile 2048 -FileMode Circular && timeout -1 && xperf -d C:\poolusage.etl

capture 2-3 minutos do uso do pool. Abra o ETL com o WPA.exe (em um segundo PC que tenha o .net 4.5 instalado), adicione os gráficos do Pool ao painel de análise.

Solicite as colunas como você as vê na foto, carregue os símbolos dentro do WPA.exe e expanda a pilha da tag "File" que você viu no poolmon.

Aqui,atagFileéusadapor locate32.exe , que verifica o sistema de arquivos para criar um índice de pesquisa.

    
por 22.10.2015 / 06:24