Como descubro o que está causando uso excessivo de CPU no mecanismo de contêiner do Google?

1

Eu tenho um cluster de nó único no mecanismo de contêiner que fica em ~ 40% de cpu quando inativo, conforme visto pelo painel de monitoramento.

Quando clico no monitoramento, todos os pods estão em 0% cpu.

Quando eu ssh na instância, posso ver que docker, kubelet e heapster são os principais culpados, mas não entendo o trabalho que estão fazendo.

Se eu olhar nos registros, vejo linhas como as seguintes, repetidas várias vezes por segundo. Eu estou supondo que isso está relacionado.

gke-rogue-dev-7248e467-node-9hvh 2015-10-13 19:50:55.000 time="2015-10-13T23:50:55Z" level=info msg="-job containers() = OK (0)"
gke-rogue-dev-7248e467-node-9hvh 2015-10-13 19:50:55.000 time="2015-10-13T23:50:55Z" level=info msg="+job containers()"
gke-rogue-dev-7248e467-node-9hvh 2015-10-13 19:50:55.000 time="2015-10-13T23:50:55Z" level=info msg="GET /containers/json"

Qual deve ser o próximo passo para descobrir por que isso está acontecendo?

    
por Marc Hughes 14.10.2015 / 02:10

1 resposta

2

Eu fiz a mesma pergunta recentemente: link

A resposta para "o trabalho que estão fazendo" é "registro e monitoramento".

Para evitar essa sobrecarga, você só precisa desmarcar esses recursos ao criar o cluster. No console do desenvolvedor, há caixas de seleção para eles. Na CLI, adicione as opções --no-enable-cloud-logging --no-enable-cloud-monitoring ao comando gcloud container clusters create .

    
por 19.10.2015 / 10:06