Descobri a (s) causa (s) raiz (es) e atualizarei-as aqui:
A alta CPU do CAS foi causada por
-
Servidores BES. Isso foi esporádico e variável
-
Registro no diário. Nossos processos de arquivamento usavam 8000 conexões MAPI para um servidor e causavam alta CPU
-
Usuários do Outlook no NAT. Muitas pessoas usando o Outlook em qualquer lugar estavam por trás de um NAT. Nossa carga balanceadora de carga os equilibrava por IP em vez de cookie (como 2010 sp1 + suporta)
-
Problema de calendário do Activesync. Os iPhones estavam martelando nosso servidor com atualizações de calendário que foram rejeitadas devido a um bug de programação da Apple. Interrompemos o pool de aplicativos do ActiveSync e a descoberta automática atualizada para apontar todos os usuários do Activesync para uma matriz de CAS dedicada
Então, no final, a solução foi criar um array CAS dedicado para o tráfego de Jornaling, Activesync e Outlook Anywhere. Nós co-localizamos o Journaling + BES no mesmo array. Este foi um QOS do homem pobre e isolamento de falhas para cada serviço.
A ferramenta que usamos para identificar o alto culpado da CPU foi "Exmon", mas saiba que a execução do Exmon fará com que arquivos de rastreamento apareçam em \ arquivos de programas (x86) \ Exmon. Se esses arquivos não forem excluídos, eles poderão preencher a unidade.