juju A configuração do Kubernetes Core não inicia após a reinicialização no Ubuntu Server 16.04.2 LTS

2

Estou tentando configurar um sistema Kubernetes em um servidor (48 núcleos e 65 GB de RAM). Eu imaginei que conjure-up / juju seria o caminho a seguir e instala os serviços e os inicia, mas quando eu reinicio o servidor, apenas alguns dos serviços aparecem novamente, os outros ficam presos em um estado de espera.

Por que os serviços não estão sendo iniciados, a seção "Mensagem" fornece algumas mensagens diferentes toda vez que eu reinicializo. O dump abaixo é depois que o servidor está ativo há pelo menos 12 horas, então não parece consertar isso sozinho.

O que estou fazendo de errado?

$ juju status
Model                        Controller                Cloud/Region         Version
conjure-kubernetes-core-da5  conjure-up-localhost-989  localhost/localhost  2.1.3

App                Version  Status   Scale  Charm              Store       Rev  OS      Notes
easyrsa            3.0.1    active       1  easyrsa            jujucharms    9  ubuntu  
etcd               2.3.8    active       1  etcd               jujucharms   34  ubuntu  
flannel            0.7.0    waiting      2  flannel            jujucharms   15  ubuntu  
kubernetes-master  1.6.2    waiting      1  kubernetes-master  jujucharms   19  ubuntu  exposed
kubernetes-worker  1.6.2    active       1  kubernetes-worker  jujucharms   23  ubuntu  exposed

Unit                  Workload  Agent  Machine  Public address  Ports           Message
easyrsa/0*            active    idle   0        10.0.8.11                       Certificate Authority connected.
etcd/0*               active    idle   1        10.0.8.69       2379/tcp        Errored with 0 known peers
kubernetes-master/0*  waiting   idle   2        10.0.8.131      6443/tcp        Waiting to retry addon deployment
  flannel/0           waiting   idle            10.0.8.131                      Waiting for Flannel
kubernetes-worker/0*  active    idle   3        10.0.8.115      80/tcp,443/tcp  Kubernetes worker running.
  flannel/1*          waiting   idle            10.0.8.115                      Waiting for Flannel

Machine  State    DNS         Inst id        Series  AZ
0        started  10.0.8.11   juju-36585e-0  xenial  
1        started  10.0.8.69   juju-36585e-1  xenial  
2        started  10.0.8.131  juju-36585e-2  xenial  
3        started  10.0.8.115  juju-36585e-3  xenial  

Relation      Provides           Consumes           Type
certificates  easyrsa            etcd               regular
certificates  easyrsa            kubernetes-master  regular
certificates  easyrsa            kubernetes-worker  regular
cluster       etcd               etcd               peer
etcd          etcd               flannel            regular
etcd          etcd               kubernetes-master  regular
cni           flannel            kubernetes-master  regular
cni           flannel            kubernetes-worker  regular
cni           kubernetes-master  flannel            subordinate
kube-control  kubernetes-master  kubernetes-worker  regular
cni           kubernetes-worker  flannel            subordinate
    
por tirithen 09.06.2017 / 13:24

1 resposta

2

Parece que etcd falha ao inicializar e snapd falha ao carregar alguma dependência. Esta questão do GitHub recomenda fazer o seguinte:

juju run --application etcd 'service snap.etcd.etcd restart'
juju run --application kubernetes-master 'service snap.kube-apiserver.daemon restart'
juju run --application kubernetes-master 'service snap.kube-controller-manager.daemon restart'
juju run --application kubernetes-master 'service snap.kube-scheduler.daemon restart'
juju run --application kubernetes-worker 'service snap.kubelet.daemon restart'
juju run --application kubernetes-worker 'service snap.kube-proxy.daemon restart'

Isso funcionou para mim usando o charme base do Kubernetes e a variante "canônica".

    
por 06.08.2017 / 01:13

Tags