Monitore o hardware DELL no servidor VMware ESXi 5.5

11

Apesar de pesquisar este tópico um pouco on-line (para ser justo eu não sou um administrador de tempo integral) eu sou incapaz de descobrir isso.

Temos vários servidores VMWare ESXi 5.5, alguns dos quais integrados ao vSphere, alguns dos quais não são (por motivos de custo).

Todos eles executam a imagem padrão do ESXi, com a exceção de uma máquina que, na verdade, está executando a imagem do DELL VMWare ESXi.

O que eu gostaria de realizar parece simples: Configurar o sistema para que possa ser consultado via SNMP a partir de um host remoto, seja snmpwalk, Nagios, PRTG etc. Eu gostaria de ver informações de sensores de temperatura, discos instalados e seu status, velocidade do ventilador, status de PSU, etc.

Fiquei com a impressão de que instalar a versão VMWare da DELL ativaria automaticamente os módulos necessários (o OpenManage é o mais importante), mas parece que não é o caso.

Eu tenho informações conflitantes se isso é mesmo possível, alguns documentos dizem que você não pode consultar um servidor DELL VMWare ESXi via SNMP e você precisa usar um cliente CIM. Depois, há os VIBs do OMSA que podem ser instalados, etc.

Eu imagino que este seja um requisito bastante comum, mas os documentos disponíveis atraem um em todas as direções diferentes.

O que eu estou tentando fazer é possível (sem um ambiente vSphere completo)?

    
por Lucky Luke 26.03.2016 / 00:17

4 respostas

5

Sim, você pode monitorar o host independente do ESXi usando qualquer software de monitoramento SNMP, mas alguns itens só podem ser vistos usando uma ferramenta de monitoramento que suporte o protocolo CIM.

Todos os meus hosts ESXi fazem parte do vCenter, mas os monitoramos diretamente (usando o endereço IP do host vmkernal) com o SolarWinds NPM. Existem 5 ou 6 módulos CIM embutidos no ESXi 5.5 que lhe dão saúde de hardware, mas a integridade da placa RAID não é um deles. Você precisará adicionar o Dell OMSA VIB que adiciona os agentes CIM adicionais, incluindo o da matriz RAID. O post de Brian Atkinson ainda é o melhor que eu encontrei que descreve o processo,

link

Você só precisa seguir as instruções para instalar o OMSA ESXi VIB se for usar uma ferramenta de monitoramento de terceiros que forneça informações históricas e faça alertas. Se você deseja usar o Dell OMSA Server, pode instalá-lo remotamente no servidor básico, remotamente em uma VM ou localmente como uma VM.

Você pode usar o servidor OMSA para se conectar a cartões de gerenciamento DRAC e iDRAC fora de banda (OOB / IPMI / iLo) ou ao host ESXi depois de instalar o OMSA VIB no host ESXi. Você não verá as informações de RAID Health no DRAC ou no iDRAC - apenas ao conectar o OMSA Server a um host ESXi - repito a palavra-chave Server para que não haja confusão entre o servidor que está agindo como um cliente para o OMSA VIB está instalado no host ESXi.

Alguns recursos úteis:

Mostrar os provedores CIM atuais em um host ESXi link

Mostrar os VIBs atualmente instalados no host ESXi a partir da CLI do host, esxcli software vib list

Você vê alguns pequenos detalhes adicionais de integridade de hardware quando se conecta a um servidor vCenter em relação ao host ESXi diretamente, mas geralmente, se não encontrar a integridade do hardware que está procurando no painel Configuração / Status de Funcionamento, estará faltando um Provedor CIM e você precisa localizar e instalar o VIB no host ESXi. Ao adicionar o Dell OMSA VIB ao host ESXi, você verá um sensor de armazenamento adicionado à página Health Status, que mostra os volumes RAID, as unidades, o controlador e a integridade da bateria do controlador de armazenamento. Pode ser necessário redefinir os sensores para que ele apareça e às vezes leva de 15 a 20 minutos na primeira vez após a instalação e reinicialização do VIB do host ESXi.

Se você não vir um sensor na página de status de integridade do host ESXi ao se conectar ao vSphere Client, provavelmente não o verá quando estiver pesquisando remotamente os sensores com o software de monitoramento.

Além disso, você deve observar que nem todos os servidores possuem os mesmos sensores e talvez você não consiga obter o mesmo status de integridade, dependendo do hardware do Servidor, da placa RAID e da versão do CIM disponível para a combinação. Você também pode precisar atualizar ou alterar os VIBs para a placa RAID para que o status de funcionamento funcione. O provedor CIM (que é o VIB do OMSA neste caso) fala com o hardware através do dispositivo VIB (o driver de dispositivo real) e passa essas informações para o Broker CIM no ESXi Host - também conhecido como o Daemon de Broker CIM Small Footprint ( sfcbd). Quando você pesquisa o host ESXi em busca de integridade de hardware usando um software de monitoramento robusto, ele obtém algumas informações usando consultas SNMP, algumas usando o CIM e algumas usando a API do ESXi (que são solicitações SOAP). O cliente CIM fala com o processo sfcbd no host ESXi.

Às vezes, o processo CIM simplesmente pára de funcionar. Quando isso acontecer, você estará reiniciando o processo sfcbd-watchdog no host ESXi. Isso irá reiniciar o serviço sfcbd e o polling CIM funcionará novamente. Da CLI do host, /etc/init.d/sfcbd-watchdog restart

Eu acho que abrange a maioria dos itens que você precisa para começar a correr.

    
por 29.03.2016 / 21:01
4

Eu entendo o que você está procurando; notas específicas sobre como gerenciar e monitorar a integridade de um host independente do VMware ESXi.

Na prática, a abordagem deve ser ligeiramente diferente. Vou explicar como gerencio os hosts.

Em uma situação em que você tem vários hosts ESXi sob o gerenciamento do vCenter, presume-se que você aproveite o vCenter para monitoramento e status de integridade , em vez de consultar os hosts individuais. Há um alarme genérico que configuro no vCenter para alertar sobre "Integridade do hardware do host". Eu normalmente não ligo se é uma fonte de alimentação, RAM, disco ou qualquer outro componente, mas sim que o host não é saudável.

O monitoramento de um host ESXi autônomo não será muito útil, pois o objetivo dos drivers Dell / HP é expor informações ao vCenter. E não acredito que seja a melhor prática consultar hosts individuais dessa maneira. É verdade que você deseja que seus hosts de VM sejam gerenciados de maneira centralizada.

Se você executar o vCenter com um único host, você terá essa capacidade, então talvez essa seja uma opção para o seu ambiente.

Se você precisar de algum tipo de monitoramento fora de banda, não poderia consultar o DRAC?

    
por 28.03.2016 / 16:13
0

você pode usar o excelente link (com ou sem nagios), ele aproveita a API vmware para obter todas as informações necessárias para o monitoramento de hardware:

check_vmware_api -H esxhost -u esx_user_read_only_role -p passwd -l runtime -s health [enter]
OK - All 450 health checks are Green 

Você precisa do perl vmware sdk, mas além disso, é bastante simples. Ele funciona para todos os tipos de hardware (desde que os sensores sejam vistos pela API vmware, eles são verificados).

    
por 29.03.2016 / 21:47
-1

Experimente o zabbix ( link ):

1) é perfeito, bem conhecido software de monitoramento de classe mundial

2) você pode começar facilmente com o aplicativo Zabbix disponível também como imagem virtual pré-configurada (com base no OpenSuSE).

3) ele pode monitorar hosts e máquinas ESX [I] usando serviços da Web Vmware (como web-client). Você pode usar regras de descoberta de baixo nível para descobrir automaticamente hipervisores e máquinas virtuais VMware e criar hosts para monitorá-los, com base em protótipos de host pré-definidos.

4) você poderá monitorar todo o hardware de seus servidores Dell usando SNMP via iDrac, incluindo o controlador raid e seu status de volumes, discos físicos / módulos de memória / PSU e assim por diante ...

Todo o tipo de informações de status de hardware [como disponível no iDrac] pode ser acessado via SNMP (pelo menos em servidores com IDrac 7/8 - eu implementei o monitoramento de hardware de 50+ servidores de geração Dell 12/13 para minha empresa desta forma).

Com o recurso perfeito de LLD (low-level-discovery) do zabbix você pode facilmente coletar todos os componentes de hardware para monitoramento sem enumeração manual e criar automaticamente itens para monitoramento (status, temperaturas, velocidade do ventilador, tamanhos de disco e séries) ), gatilhos (expressões para processar dados de monitoramento) e várias ações ...

    
por 29.03.2016 / 22:05