Estou trabalhando com o aplicativo de benchmark NAS, realizando checkpoints coordenados com o DMTCP 2.4,
Agora eu tenho vários scripts, um move meus pontos de verificação entre nós, outro para chenge o dmtcp_restart_script.sh e outro para reiniciar o aplicativo NAS no novo nó.
Quando eu executo cada script no nó que deve funcionar, ele é codificado, o problema é quando eu construo um novo script para chamar todos os scripts diferentes e conecto-os através do ssh.
Este é o código para chamar os scripts:
ssh -TX user@node3 /home/user/programs/restartCkpt.sh $argument1 $argument2
Este é o código do script restartCkpt.sh
#!/bin/sh
# First Parameter is the Port number
# Second Parameter is the Interval of time (in seconds) for the checkpoints
export PATH
echo --------- Connected to $HOSTNAME to launch checkpoint -----------------
cd /tmp/tests/local/
/home/user/dmtcp/bin/dmtcp_coordinator -p $1 -i $2 --daemon
/tmp/tests/local/dmtcp_restart_script.sh
if [ "$?" -eq "0" ]
then
echo "The Restart WORKS!!"
else
echo ERROR in the restart! in cluster $HOSTNAME
fi
Alguém sabe porque é que não consigo reiniciar o ponto de verificação "automaticamente"? Obrigado
Tags ssh scripting checkpoint