Teste o script / programa / aplicativo para verificar se meu site está ativo

1

Eu acabei de implantar meu servidor usando o Apache no CentOS e fiquei me perguntando se alguém tem boas idéias em como verificar cada período de tempo especificado se o servidor ficar inativo e eu posso usar o postfix para me enviar e-mail quando isso acontecer pode voltar ao meu servidor imediatamente e corrigir o problema também para ver o que causou o problema. Acredito que muitos sites usem algum software / script para que eles saibam quando o serviço falha antes que os clientes comecem a reclamar do problema.

    
por VaTo 03.06.2015 / 21:43

2 respostas

1

Você pode ter um script no seu servidor que faça todo tipo de teste entre eles, se o servidor estiver ativo, aqui está um deles:

#!/bin/bash
    date;
    echo "uptime:"
    uptime
    echo "Currently connected:"
    w
    echo "--------------------"
    echo "Last logins:"
    last -a |head -3
    echo "--------------------"
    echo "Disk and memory usage:"
    df -h | xargs | awk '{print "Free/total disk: " $11 " / " $9}'
    free -m | xargs | awk '{print "Free/total memory: " $17 " / " $8 " MB"}'
    echo "--------------------"
    start_log='head -1 /var/log/messages |cut -c 1-12'
    oom='grep -ci kill /var/log/messages'
    echo -n "OOM errors since $start_log :" $oom
    echo ""
    echo "--------------------"
    echo "Utilization and most expensive processes:"
    top -b |head -3
    echo
    top -b |head -10 |tail -4
    echo "--------------------"
    echo "Open TCP ports:"
    nmap -p- -T4 127.0.0.1
    echo "--------------------"
    echo "Current connections:"
    ss -s
    echo "--------------------"
    echo "processes:"
    ps auxf --width=200
    echo "--------------------"
    echo "vmstat:"
    vmstat 1 5

Isso forneceria os seguintes resultados:

./Server-Health.sh

Tue Jul 16 22:01:06 IST 2013
uptime:
 22:01:06 up 174 days,  4:42,  1 user,  load average: 0.36, 0.25, 0.18
Currently connected:
 22:01:06 up 174 days,  4:42,  1 user,  load average: 0.36, 0.25, 0.18
USER     TTY      FROM              LOGIN@   IDLE   JCPU   PCPU WHAT
tecmint   pts/0    116.72.134.162   21:48    0.00s  0.03s  0.03s sshd: tecmint [priv]
--------------------
Last logins:
tecmint   pts/0        Tue Jul 16 21:48   still logged in    116.72.134.162
tecmint   pts/0        Tue Jul 16 21:24 - 21:43  (00:19)     116.72.134.162
--------------------
Disk and memory usage:
Free/total disk: 292G / 457G
Free/total memory: 3510 / 3838 MB
--------------------
OOM errors since Jul 14 03:37 : 0
--------------------
Utilization and most expensive processes:
top - 22:01:07 up 174 days,  4:42,  1 user,  load average: 0.36, 0.25, 0.18
Tasks: 149 total,   1 running, 148 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.1%us,  0.0%sy,  0.0%ni, 99.3%id,  0.6%wa,  0.0%hi,  0.0%si,  0.0%st

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
    1 root      20   0  3788 1128  932 S  0.0  0.0   0:32.94 init
    2 root      20   0     0    0    0 S  0.0  0.0   0:00.00 kthreadd
    3 root      RT   0     0    0    0 S  0.0  0.0   0:14.07 migration/0
    
por 21.06.2015 / 05:38
5

existem ferramentas como nagios ou icinga que pode monitorar um servidor.

eles podem monitorar muito mais do que apenas http url: coisas linke ssh , mysql , se o espaço em disco ficar escasso - e muito mais. pode ser um pouco exagerado para o seu uso? os serviços escrevem emails se as coisas falharem.

    
por 03.06.2015 / 21:52