Juju status machines 1 2 3 instance-id: pendente para sempre

1

Estou construindo um ambiente MAAS com 4 máquinas físicas.

  • 1 está executando o MAAS e o Ubuntu 13.04

  • 3 são nós MAAS executando o Ubuntu 12.10 (máquina 0,1,2)

Meu problema é que, após o bootstrap do juju, somente a máquina 0 recebe um agente em execução. Todos os 3 nós foram configurados no mesmo dia.

A interface de usuário da web do MAAS mostra todos os nós como "allocated to root" .

Você pode ssh diretamente para a máquina 1 & amp; 2 e não parece haver nenhum vestígio de juju sendo instalado neles. Você não pode juju ssh 1 ou juju ssh 2

Aqui está juju status:

system@ubuntu1:~$ juju status
2013-11-22 23:19:40,553 INFO Connecting to environment...
2013-11-22 23:19:41,137 INFO Connected to environment.
machines:
  0:
    agent-state: running
    dns-name: 3ycae.ceph
    instance-id: /MAAS/api/1.0/nodes/node-d4ef6adc-522b-11e3-abf4-deadbeeefb1a/
    instance-state: unknown
  1:
    instance-id: pending
  2:
    instance-id: pending
  3:
    instance-id: pending
services: {}
2013-11-22 23:19:41,200 INFO 'status' command finished successfully

Eu tentei juju destroy-environment, o DNS está funcionando corretamente, todos eles podem pingar uns aos outros pelo nome. Eu tenho o firewall desativado no host MAAS . Eu tentei implantar serviços, mas isso não ajuda.

system@ubuntu1:~$ juju status
2013-11-22 23:23:54,514 INFO Connecting to environment...
2013-11-22 23:23:55,082 INFO Connected to environment.
machines:
  0:
    agent-state: running
    dns-name: 3ycae.ceph
    instance-id: /MAAS/api/1.0/nodes/node-d4ef6adc-522b-11e3-abf4-deadbeeefb1a/
    instance-state: unknown
  1:
    instance-id: pending
  2:
    instance-id: pending
  3:
    instance-id: pending
services:
  munin:
    charm: cs:precise/munin-3
    relations: {}
    units:
      munin/4:
        agent-state: pending
        machine: 1
        public-address: null
      munin/5:
        agent-state: pending
        machine: 2
        public-address: null
      munin/6:
        agent-state: pending
        machine: 3
        public-address: null
 2013-11-22 23:23:55,221 INFO 'status' command finished successfully

Se eu executar juju -v ssh 1 , recebo esta saída, talvez isso lhe dê uma pista.

system@ubuntu1:~$ juju -v ssh 1
2013-11-22 23:28:16,858 DEBUG Initializing juju ssh runtime
2013-11-22 23:28:16,862 INFO Connecting to environment...
2013-11-22 23:28:16,909 DEBUG Connecting to environment using 3ycae.ceph...
2013-11-22 23:28:16,909 DEBUG Spawning SSH process with remote_user="ubuntu"     remote_host="3ycae.ceph" remote_port="2181" local_port="39791".
2013-11-22 23:28:17,416:6182(0x7fa5364bd700):ZOO_INFO@log_env@658: Client environment:zookeeper.version=zookeeper C client 3.3.5
2013-11-22 23:28:17,416:6182(0x7fa5364bd700):ZOO_INFO@log_env@662: Client environment:host.name=ubuntu1
2013-11-22 23:28:17,416:6182(0x7fa5364bd700):ZOO_INFO@log_env@669: Client environment:os.name=Linux
2013-11-22 23:28:17,416:6182(0x7fa5364bd700):ZOO_INFO@log_env@670: Client environment:os.arch=3.8.0-29-generic
2013-11-22 23:28:17,416:6182(0x7fa5364bd700):ZOO_INFO@log_env@671: Client environment:os.version=#42~precise1-Ubuntu SMP Wed Aug 14 16:19:23 UTC 2013
2013-11-22 23:28:17,417:6182(0x7fa5364bd700):ZOO_INFO@log_env@679: Client environment:user.name=system
2013-11-22 23:28:17,417:6182(0x7fa5364bd700):ZOO_INFO@log_env@687: Client environment:user.home=/home/system
2013-11-22 23:28:17,417:6182(0x7fa5364bd700):ZOO_INFO@log_env@699: Client environment:user.dir=/home/system
2013-11-22 23:28:17,417:6182(0x7fa5364bd700):ZOO_INFO@zookeeper_init@727: Initiating   client connection, host=localhost:39791 sessionTimeout=10000 watcher=0x7fa5344886b0  sessionId=0 sessionPasswd=<null> context=0x25c4150 flags=0
2013-11-22 23:28:17,418:6182(0x7fa531263700):ZOO_INFO@check_events@1585: initiated connection to server [127.0.0.1:39791]
2013-11-22 23:28:17,427:6182(0x7fa531263700):ZOO_INFO@check_events@1632: session establishment complete on server [127.0.0.1:39791], sessionId=0x1427dc75f5d003a, negotiated timeout=10000
2013-11-22 23:28:17,431 DEBUG Environment is initialized.
2013-11-22 23:28:17,431 INFO Connected to environment.
2013-11-22 23:28:17,432 DEBUG Fetching machine address using juju machine id.
Traceback (most recent call last):
  File "/usr/lib/python2.7/dist-packages/twisted/internet/defer.py", line 1039, in _inlineCallbacks
result = g.send(result)
File "/usr/lib/python2.7/dist-packages/juju/control/utils.py", line 56, in get_ip_address_for_machine
provider_machine = yield provider.get_machine(instance_id)
File "/usr/lib/python2.7/dist-packages/juju/providers/common/base.py", line 178, in get_machine
d = self.get_machines([instance_id])
File "/usr/lib/python2.7/dist-packages/twisted/internet/defer.py", line 1181, in unwindGenerator
return _inlineCallbacks(None, gen, Deferred())
--- <exception caught here> ---
File "/usr/lib/python2.7/dist-packages/twisted/internet/defer.py", line 1039, in _inlineCallbacks
result = g.send(result)
File "/usr/lib/python2.7/dist-packages/juju/providers/maas/provider.py", line 91, in get_machines
instances = yield self.maas_client.get_nodes(instance_ids)
File "/usr/lib/python2.7/dist-packages/juju/providers/maas/maas.py", line 96, in  get_nodes
for resource_uri in resource_uris)
File "/usr/lib/python2.7/dist-packages/juju/providers/maas/maas.py", line 96, in <genexpr>
for resource_uri in resource_uris)
File "/usr/lib/python2.7/dist-packages/juju/providers/maas/maas.py", line 35, in   extract_system_id
match = _re_resource_uri.search(resource_uri)
exceptions.TypeError: expected string or buffer
2013-11-22 23:28:17,457 ERROR Traceback (most recent call last):
File "/usr/lib/python2.7/dist-packages/twisted/internet/defer.py", line 1039, in _inlineCallbacks
result = g.send(result)
File "/usr/lib/python2.7/dist-packages/juju/control/utils.py", line 56, in  get_ip_address_for_machine
provider_machine = yield provider.get_machine(instance_id)
File "/usr/lib/python2.7/dist-packages/juju/providers/common/base.py", line 178, in get_machine
d = self.get_machines([instance_id])
File "/usr/lib/python2.7/dist-packages/twisted/internet/defer.py", line 1181, in unwindGenerator
return _inlineCallbacks(None, gen, Deferred())
--- <exception caught here> ---
File "/usr/lib/python2.7/dist-packages/twisted/internet/defer.py", line 1039, in _inlineCallbacks
result = g.send(result)
File "/usr/lib/python2.7/dist-packages/juju/providers/maas/provider.py", line 91, in get_machines
instances = yield self.maas_client.get_nodes(instance_ids)
File "/usr/lib/python2.7/dist-packages/juju/providers/maas/maas.py", line 96, in get_nodes for resource_uri in resource_uris)
File "/usr/lib/python2.7/dist-packages/juju/providers/maas/maas.py", line 96, in <genexpr> for resource_uri in resource_uris)
File "/usr/lib/python2.7/dist-packages/juju/providers/maas/maas.py", line 35, in extract_system_id
match = _re_resource_uri.search(resource_uri)
exceptions.TypeError: expected string or buffer

expected string or buffer
2013-11-22 23:28:17,459 ERROR expected string or buffer
system@ubuntu1:~$ 

Como posso resolver isso?

    
por davegempton 22.11.2013 / 11:43

2 respostas

1

Baseado no traceback, você está usando o Juju 0.7 - a última versão estável do Juju é a 1.16.3 - por favor, destrua o ambiente, atualize o juju para o 1.16.3 e tente fazer o bootstrap novamente.

    
por Marco Ceppi 24.11.2013 / 17:00
0

Agora eu tenho o cluster Ceph de 3 nós funcionando e posso derrubá-lo e reconstruí-lo todas as vezes.

Estou usando o Ubunto 12.04 LTS & amp; MAAS 1.2 + bzr1373 + dfsg-0ubuntu1 ~ & amp; juju 0.5 + bzr531-0ubuntu1.3.

Isso é o que eu aprendi sobre essa configuração.

A) Um cluster Ceph de 3 nós precisa de 5 máquinas.

  1. servidor MAAS
  2. Servidor do zookeeper (sempre é a máquina 0)

    3,4,5. Os 3 nós que terão o Ceph implantado






ordem de ingressar no MAAS, inicializando nós e executando juju bootstrap é super crítica.

Aqui estão os meus passos recomendados ...

Instale os pacotes MAAS e juju seguindo o guia de instalação padrão.

Prepare uma máquina para a inicialização do PXE. Isso vai se tornar a máquina 0 e será o zelador.

O PXE inicializa a máquina e aguarda a inicialização e o desligamento automático. Agora será exibido no MAAS Gui.

A partir do MAAS Gui, edite o nó e Aceite / Comissione o nó. Provavelmente não será o WOL, portanto inicialize-o manualmente ou com o "power_ake MAC_Address". Deixe-o inicializar e espere o desligamento automático. O status do nó MAAS Gui agora está "pronto".

Agora você deve executar o "juju bootstrap" no servidor MAAS. Inicialize o nó novamente (NÃO USE o botão de início do MAAS Gui). O nó agora instalará o sistema operacional e instalará o zookeeper. Quando isso terminar, execute o status juju e a máquina 0 estará em execução. O status do nó MAAS Gui será "alocado para root".

Agora, prepare seus 3 nós CEPH. PXE inicialize-os e espere que eles inicializem e desliguem automaticamente. Eles estarão agora no MAAS. A partir do MAAS Gui aceite / comunique-os. Inicialize-os novamente com "powerwake MAC_address". Aguarde que eles inicializem e desliguem automaticamente. Eles agora terão o status MAAS pronto e o status juju mostrará as máquinas 1, 2, & amp; 3 como id de instância: pendente.

Agora execute "juju deploy --config ./ceph.yaml -n 3 ceph". Nesse ponto, a juju quer provisionar mais 3 máquinas.

Inicialize cada um dos 3 nós CEPH com "power_ake MAC_address" e cada um deles instalará o sistema operacional e receberá a configuração CEPH.

Este último passo leva algum tempo, então resista ao desejo de destruí-lo e começar de novo. Seja paciente.

Note que o encanto CEPH não instalará os componentes osd se você tiver o osd-journal: no arquivo ceph.yaml.

Este é o meu ceph.yaml:

ceph:
  fsid: 6ca7da3e-4760-11e3-836d-ab53797f3654
  monitor-secret: AQDoDntSQErjFBAAMcVBPAiMgVNdqSO7tjjGDw==
  osd-devices: /dev/sdb /dev/sdc /dev/sdd /dev/sde

No final, você terá um status de juju como esse ...

system@ubuntu1:~$ juju status
2013-11-27 10:13:08,997 INFO Connecting to environment...
2013-11-27 10:13:09,888 INFO Connected to environment.
machines:
  0:
    agent-state: running
    dns-name: rawpt.ceph
    instance-id: /MAAS/api/1.0/nodes/node-69ef3540-557e-11e3-91c1-deadbeeefb1a/
    instance-state: unknown
  1:
    agent-state: running
    dns-name: mm6c3.ceph
    instance-id: /MAAS/api/1.0/nodes/node-cf74149e-5583-11e3-8493-deadbeeefb1a/
    instance-state: unknown
  2:
    agent-state: running
    dns-name: tknpg.ceph
    instance-id: /MAAS/api/1.0/nodes/node-49682620-5587-11e3-8493-deadbeeefb1a/
    instance-state: unknown
  3:
    agent-state: running
    dns-name: 3ghwq.ceph
    instance-id: /MAAS/api/1.0/nodes/node-6da6cfd2-5587-11e3-91c1-deadbeeefb1a/
    instance-state: unknown
services:
  ceph:
    charm: cs:precise/ceph-18
    relations:
     mon:
      - ceph
    units:
      ceph/10:
        agent-state: started
        machine: 2
        public-address: tknpg.ceph
      ceph/11:
        agent-state: started
        machine: 3
        public-address: 3ghwq.ceph
      ceph/9:
        agent-state: started
        machine: 1
        public-address: mm6c3.ceph
2013-11-27 10:13:10,110 INFO 'status' command finished successfully


system@ubuntu1:~$ juju ssh 1 sudo ceph -s
2013-11-27 10:24:12,452 INFO Connecting to environment...
2013-11-27 10:24:13,026 INFO Connected to environment.
2013-11-27 10:24:13,059 INFO Connecting to machine 1 at mm6c3.ceph
   health HEALTH_OK
   monmap e2: 3 mons at {3ghwq=191.168.0.152:6789/0,mm6c3=191.168.0.150:6789/0,tknpg=191.168.0.151:6789/0}, election epoch 2, quorum 0,1,2 3ghwq,mm6c3,tknpg
   osdmap e25: 12 osds: 12 up, 12 in
    pgmap v120: 192 pgs: 192 active+clean; 0 bytes data, 12446 MB used, 44678 GB / 44690 GB avail
   mdsmap e1: 0/0/1 up
    
por davegempton 26.11.2013 / 22:22