Parar o cron job constantemente reiniciando a instância ec2

0

Eu criei um script para reinicializar o sistema quando a carga da CPU atingiu 90%. Mas, para algum propósito de teste, alterei o valor da utilização máxima da CPU para 0,7%.

O script está programado para executar a reinicialização do sistema.

Agora o servidor nunca está on-line - ele é constantemente reinicializado.

Meu script:

#!/bin/bash
dstat| awk '{ if (int($1)>0.7) { 
              i=i+1; {
                       print i, $1
               }
              }

           if (int($1)>0.7) {
           j=j+1;
           }   
           if (j>2) {
                  print "system reboot";
                  cmd="sudo reboot";
                  system(cmd)
           }
        }'

NB o script está programado para rodar na reinicialização usando o crontab:

@reboot /bin/bash /ubuntu/home/reboot.sh

Portanto, não consigo fazer login usando o SSH. Porque o sistema está constantemente reiniciando.

Meu servidor é uma instância do AWS ec2

Eu tentei passar dados do usuário através do console aws.

sudo apt-get purge dstat
cd /ubuntu/home && sudo rm reboot.sh
sudo /etc/init.d/cron stop

Mas isso não funciona.

Assim, todas as maneiras possíveis de recuperar minha instância seriam muito apreciadas.

    
por Anmol Rastogi 26.04.2018 / 16:13

1 resposta

0
  1. Pare a instância e dê uma olhada no disco do EBS (anote o ponto de montagem)
  2. Detecte o disco rígido da instância com falha (EBS)
  3. Inicialize uma nova instância nova (Ubuntu 18.04, RHEL, aquela com a qual você se sente mais confortável ...)
  4. Anexe o disco com falha à nova instância.
  5. Monte o sistema de arquivos em /mnt (por exemplo)
  6. Remova a regra do crontab que você adicionou ao CRONTAB (em /etc/crontab/ ...)
  7. Desanexe o disco do EBS
  8. Anexe novamente à máquina com falha, usando o mesmo ponto de montagem
  9. Inicialize sua máquina antiga como sempre; cron será desativado
  10. Remova a máquina que você usou para alterar o FS

É um padrão comum com falha, para detectar um FS com falha em outra máquina, consertar o que estiver impedindo a inicialização e anexá-lo novamente ao host antigo.

Espero que isso resolva seu problema.

    
por jan 08.10.2018 / 20:03