Maas encomendará a máquina, mas não me deixará ligá-la

0

Eu tenho um sistema maas / juju existente que eu posso construir do zero com scripts e fazer regularmente, esses são os sistemas Dell C6015. Acabei de obter mais 6 máquinas - HP DL580 G7s. Eu reconstruí o cluster a partir do zero, e o MAAS vê as novas máquinas e pode encomendá-las. Eles mostram o número correto de núcleos, memória e disco, e mostram "pronto". Os sistemas originais da Dell entram em operação e funcionam bem, e são alocados e provisionados por juju.

Eu tentei alocá-los em juju, os MAAS os iniciaram, os alocaram, marcaram a implantação e depois implantaram, mas em juju eles nunca apareceram como outros que estavam pendentes.

Eu removi-os em juju, mas eles não foram liberados, então eu os forcei e os liberei no MAAS. Eu tentei depurar seus ganchos, para ver o que estava acontecendo, e tentei realocá-los em juju, mesmo usando add-machine e adicionando unit-to, mas eles nunca foram alocados novamente. Eu pude ligá-los e desligar do MAAS por um tempo (isso parou). Eu ainda posso alocar, implantar e liberá-los, obter o MAAS para comissioná-los novamente e verificar seu status de energia.

O que o MAAS não fará é me deixar ligá-los. O MAAS me permitirá recolocá-los, e ele os rodará, ligando, executando os scripts e desligando-os, sempre que eu quiser. Eu posso adquirir, implantar e liberar, através do MAAS.

Mas quando eu seleciono um ou mais para ligar, o MAAS diz que "1 nó não pode ser ligado. Para continuar, atualize sua seleção."

Eu posso ligá-los usando a interface web do iLO (IPMI) e, quando isso acontece, posso desligá-los com o MAAS. Mas, não há alegria em começar qualquer um deles através do maas, ou fazer com que o juju ponha serviços neles.

Alguém tem alguma idéia sobre o que pode ser o problema, o que eu posso fazer para depurar o problema, ou quer que eu adicione informações de log do MAAS ou juju? Toda ajuda seria muito apreciada.

Se eu conseguir ativá-los, posso executar os scripts do serviço juju manualmente, para poder usar os núcleos. Mas sem ciclo de energia, sem alegria.

2015.12.18 Edit -----------------------

Meu trabalho atual é implantá-los manualmente:

No maas,

select the systems in question, select "Take Action"/“Acquire” and “Go”
select the systems in question, "Take Action"/“Deploy” and “Go” 

no maas-server

juju add-machine ssh:<mass user name>@<ipaddress>

Uma vez que os retornos com "máquina criada n"

juju add-unit <service> –to n

Nesse ponto, eles são acionados, implantam o serviço conforme necessário e funcionam bem.

Este não é o meu objetivo final, pois, embora eu possa desligar os sistemas para o nosso feriado de Natal, terei que ativá-los usando o iLO websight.

2015.12.18 Edit number 2-----------------------

OK. Perplexo.

Eles não responderam aos comandos manuais de ativação do MAAS depois de terem sido comissionados (e realmente inicializando e comissionando) várias vezes a partir do MAAS.

Após serem adquiridos, implantados, provisionados e executados por alguns dias, eles agora são desligados e ativados sob o comando manual no MAAS.

Alguém tem uma ideia de como marcar isso? Eu não acho que seja respondida, mas funciona.

Eu não estou olhando este presente cavalo na boca, mas fico perplexo.

    
por rmustakos 15.12.2015 / 04:57

3 respostas

1

Off hand, eu acho que isso é principalmente um problema da HP, já que o material da Dell funciona bem.

Sugiro ver primeiro se existem atualizações de firmware para o seu hardware. Existem algumas falhas nas implementações do iLO IPMI da HP, embora normalmente suas interfaces de energia pareçam confiáveis.

Em segundo lugar, os registros estão em

/var/log/maas

Há muita informação para depuração.

Por fim, você pode experimentar algumas dessas coisas manualmente. O Maas usa a ferramenta ipmi_chassis_config para inicializar máquinas. Você pode tentar executar isso diretamente da sua máquina. Os documentos estão disponíveis em man pages ou aqui:

link

Veja / etc / maas / templates / power / para algumas das opções sobre isso. Além disso, verifique as versões das ferramentas ipmi em sua máquina e procure por relatórios de erros sobre isso.

    
por Jason McIntosh 18.12.2015 / 17:42
1

Tenho tido outros problemas com a HP não estar implementando. Uma das coisas que posso em que pode ajudá-lo foi que o firmware do ilo4 não funcionará com o mais recente que eu acho que é 2.30. Se você voltar para 2.22, isso pode resolver seu problema.

    
por Baron Wolt 13.03.2016 / 09:32
0

Isso soa como um bug no MAAS ou no driver do iLO para o MAAS. O fato de isso ser específico para o novo modelo de máquina sugere que não é uma questão de Juju.

Qual versão do MAAS você está usando?

    
por Mark Shuttleworth 17.12.2015 / 13:59