Temos uma propriedade do vSphere com tamanho razoável, com 80% de nossos servidores Windows / Linux virtualizados, sendo executados em seis Datacentres. Um dos meus desafios é o planejamento de capacidade de médio a longo prazo, garantindo que eu receba dinheiro suficiente na previsão anual de Capex para garantir fundos para upgrades de host (normalmente memória), mais hosts (licenças de hardware e ESX) ou expansão de SAN no pior caso. p>
De qualquer forma, até bem recentemente, fiquei bastante confortável em aceitar as estatísticas de desempenho do vCenter como sendo verdadeiramente representativas do que está acontecendo. Eu normalmente trabalho no nível do cluster ao observar estatísticas, pois os hosts em cada cluster são identificados, atualizados, etc.
No entanto, recentemente notei algo que me deixou um pouco mais aborrecido. Um dos meus clusters tem 200GHz de "largura de banda" disponível do CPU, isto é feito da seguinte forma:
5 hosts x 2 sockets-per-host x 6 cores-per-socket x 3.33GHz per-core = 199.8GHz
Isso está bem, e o vCenter reporta esse valor corretamente. No entanto, quando você visualiza a utilização da CPU do Cluster no vCenter ou obtém estatísticas usando o Cmdlet Get-Stat , a utilização da CPU pode exceder 300 GHz às vezes. Isso tem um efeito colateral de atrapalhar meus cálculos, pois o número de utilização chega a 150% (!). Agora, faz muito tempo desde que fiz matemática de nível A, mas não consigo ver como uma CPU pode ser utilizada 150% ...
Então, eu registrei uma chamada com suporte VMware. E, risivelmente, eles disseram que eu preciso comprar o vCenter Operations Manager (vCOPS) para fazer o que estou tentando fazer. Bem, não, obrigado, se eu tiver algumas estatísticas precisas, posso fazer meu próprio apoio à decisão (desculpe, desabafo).
Então, pedi uma explicação, e o responsável pelo suporte disse que os dados no vCenter são baseados em um cálculo "genérico" que usa a soma das médias. Bem, a média de amostras de dados é bastante normal e bastante aceitável, mas ainda não consigo entender como você pode exceder 100%.
Então, eu tenho tentado resolver isso sozinho, e estou me perguntando se o hyper-threading ou o recurso "turbo" do Xeon está afetando os resultados. No entanto, o "turbo" up-lift é apenas de 3,33GHz para 3,6GHz, ou seja, 8%.
Alguma pista?