O que é o Hyper-V R2 adequado com configuração de NICs Broadcast BCM5709C da Teamed (VMQ, TOE, LSO, CSO, etc.)?

4

Eu tenho um par de servidores Dell PowerEdge R710 (2x Xeon X5690s, 64GB, 8x BCM5709C NICs) executando o Windows Server 2008 R2 Datacenter. Eles são apoiados por um Dell PowerVault MD3200 com 3,6 TB em RAID 10 (efetivamente 1,8 TB) via HBA ( não iSCSI! ). Eles foram configurados em um cluster de failover do Hyper-V.

Estou reconstruindo meu cluster devido a alguns problemas ocorridos. Como parte da reconstrução, eu também atualizei todo o firmware nos servidores (não que isso importe, mas estou colocando isso para fora).

Desde então, estou configurando um cluster "novo", e gostaria de tentar ajustar as conexões de rede um pouco melhor dessa vez. Passei incontáveis dias pesquisando as melhores práticas e isso para o meu hardware, mas ainda tenho dúvidas.

Antes de eu chegar à (s) pergunta (s), todas as NICs estão executando o firmware 7.4.8 e o driver 7.4.14.0. Eles são divididos em três equipes: Pública , Privada e Máquinas Virtuais . As equipes são do tipo Smart Load Balancing e Failover.

  • Equipe pública (2x NICs - usadas para acesso à rede do host)
  • Equipe Particular (2x NIcs - usado para cluster de failover, migração ao vivo, etc.)
  • Equipe Máquinas Virtuais (3x NICs - usadas para acesso à rede VM)

Existe também uma NIC física que é ligada como um vSwitch separado no Hyper-V e é alocada para o nosso servidor web apenas porque possui a conexão dedicada para ele.

Todas as portas são divididas entre dois switches Dell PowerConnect 6224 para redundância. Enfim, para a (s) pergunta (s):

Primeiro, quais configurações eu preciso configurar na equipe de VMs para obter o melhor desempenho de rede de VM? Pelo que eu li, eu deveria desativar TOE (TCP Conexão Offload para Broadcom?), Wake-on-LAN, Jumbo Frames, Controle de Fluxo, RSS e QoS em todos os NICs que farão parte da equipe de VMs. A única coisa que eu deveria ter ativado é LSO e CSO. Isso está correto?

EDIT: Eu também li que eu deveria programar a velocidade do link em vez de deixá-lo no auto se eu conheço as capacidades do meu hardware, isso também é uma coisa boa fazer?

Com o novo firmware e drivers, tenho a capacidade de habilitar VMQs, que depois de ler um Documento técnico da Dell sobre eles, acho que são uma boa coisa a fazer. No entanto, eu também estou lendo algo sobre as configurações do registro, e estou confuso. Eu estava seguindo um guia em um postagens no fórum no site da Broadcom, mas não tenho certeza se é uma boa ideia fazer isso, já que é para um modelo de NIC diferente. Qual é a maneira correta de configurar VMQs para trabalhar no meu hardware?

Voltando a desabilitar os Jumbo Frames de cima, eu os habilito agora para todas as equipes. Eu deveria simplesmente desativá-los completamente? Eu li (depois que eu os habilitei) que ele é usado apenas em configurações iSCSI, o que eu não sou, então não tenho certeza ...

Na conexão dedicada para o servidor da web, preciso ter o VMQ ativado se estiver disponível apenas para um servidor?

Por fim, qualquer outra recomendação para qualquer uma das conexões seria bem-vinda. Obrigado por ler isto e agradecemos antecipadamente por qualquer ajuda!

    
por Gup3rSuR4c 22.12.2012 / 00:29

1 resposta

3

Atualmente, minha loja usa NICs da Broadcom em PE710s para um cluster do Hyper-V. Muitas das opções dependem do que você está fazendo com o link específico. Em muitos casos, se um determinado recurso está habilitado ou não, não fará diferença no desempenho da NIC. Como tal, a maioria pode ser deixada em um estado padrão sem efeitos negativos. Como você está usando o armazenamento conectado diretamente, é isso que eu recomendaria e por que (com base em minha própria experiência):

TOE (Offload de conexão TCP para Broadcom) - Esse recurso é usado para transferir o gerenciamento de sessão iSCSI para o HBA. Como não parece que você esteja usando SANs iSCSI, isso pode ser desativado. Se deixado ligado, nada acontecerá, pois o recurso também deve estar configurado para funcionar.

Wake-on-LAN - Pode ser desligado com segurança. Realmente não tem efeito, supondo que seus servidores estejam sempre ativos (pessoalmente, não vejo muito sentido em ter um servidor para dormir). Há certas implicações de segurança de ter esse recurso deixado (por exemplo, pacotes mágicos desonestos), mas, novamente, se o servidor estiver sempre ativo, eles não são realmente um problema.

Jumbo Frames - Depende da sua configuração de rede e uso pretendido. Quadros Jumbo melhoram o desempenho se grandes pacotes de dados forem enviados pela rede reduzindo o número de quadros (e cabeçalhos associados). TODOS os hardwares de rede ao longo da rota de dados, além de suas NICs, devem ser capazes de suportar quadros jumbo e ter o recurso ativado antes de serem usados. Temos isso ativado para as nossas redes iSCSI e desativado para todos os outros tráfegos, já que não controlamos a infraestrutura do roteador principal. Em caso de dúvida, deixe-a. Isso pode lhe dar pesadelos de solução de problemas de rede se você o tiver ativado na NIC, mas não em outro lugar.

Controle de fluxo - depende novamente da configuração da rede. Definir isso como automático geralmente é bom. O HBA detectará automaticamente se é suportado. Apenas desativamos isso se um fornecedor especificamente recomendar que não seja usado com o hardware deles.

RSS - ou Receive-Side Scaling permite que a carga de rede de um adaptador de rede seja compartilhada entre vários processadores. O RSS permite que o processamento de recebimento de pacotes seja dimensionado com o número de processadores disponíveis. Isso permite que o subsistema de rede do Windows aproveite as arquiteturas de vários núcleos e de vários processadores core. Eu deixaria isso ligado, a menos que você tenha certeza de que está causando desempenho degradado. Informações adicionais aqui .

QoS - ou Qualidade de Serviço. Essa função marca os dados dependendo do tipo e permite o tratamento de tráfego priorizado. Útil apenas se a sua rede suportar. Se você não estiver familiarizado com a configuração de QoS, desligue-a ou tenha cuidado antes de ligá-la. Há mais para configurar isso do que apenas ligá-lo na NIC.

LSO / CSO - Large Send Offload e Checksum Offload; deixe-os ligados, a menos que você tenha um motivo convincente para desativá-lo. A sabedoria convencional é que é melhor que o HBA faça o que for possível para que a utilização de recursos da CPU seja minimizada.

Predefina a velocidade do link em vez de deixá-lo em automático - que costumava ser a sabedoria convencional, mas com links Ethernet de 1 GB e 10 GB, agora é considerado uma boa prática deixar esse conjunto em automático. Há casos em que a configuração da velocidade do link fará com que o link fique off-line.

VMQs - A Microsoft tem orientações sobre quando habilitar VMQs aqui . Nem todas as NICs Broadcom suportam VMQs, portanto, se a opção não estiver disponível no BACS, é provável que seu modelo não a suporte. Não deve haver necessidade de definir configurações de registro para ativar o recurso.

Ah, como nota final. É MUITO MUITO importante que suas NICs agrupadas estejam configuradas de forma idêntica. Não apenas entre as NICs no mesmo servidor, mas aquelas que serão usadas juntas no cluster. Idealmente, o hardware deve ser idêntico, mas se não, pelo menos, garantir que apenas os recursos idênticos estão habilitados.

    
por 27.12.2012 / 00:28