Systemd sai de scripts bash que executam comandos que resultam em falha, em vez de continuar

3

Estou tentando obter um script que envia meu log do sistema no CoreOS para log-ins. Para compensar o fato de que as instâncias não têm conectividade com a Internet imediatamente ao serem executadas na AWS, coloquei o comando em um loop while.

Executando o script a partir da linha de comando, o loop while funciona bem. Mas quando o systemd executa o script, ele sai imediatamente quando o netcat expira para que ele nunca tenha a chance de tentar novamente.

Existe uma maneira de ser menos agressivo em sair do script?

saída systemd, nunca chega a "dormir netcat"

Jul 23 22:26:21 core-01 systemd[1]: Starting Push journal logs to logentries.com...
Jul 23 22:26:21 core-01 systemd[1]: Started Push journal logs to logentries.com.
Jul 23 22:26:21 core-01 bash[880]: trying netcat
Jul 23 22:26:31 core-01 bash[880]: Ncat: Connection timed out.

journal2logentries.sh

#!/usr/bin/env bash
token=logentriestoken
while true
do
  echo 'trying netcat'
  journalctl -o short -f | awk -v token=$token '{ print token, $0; fflush(); }' | ncat --ssl --ssl-verify data.logentries.com 20000
  echo 'sleeping netcat'
  sleep 30s
done

logentries.service

[Unit] 
Description=Push journal logs to logentries.com 
After=systemd-journald.service
After=systemd-networkd.service

[Service]
Restart=always
ExecStart=/bin/bash /home/core/journal2logentries.sh

[Install]
WantedBy=multi-user.target

Atualização:

Parece que o problema real é que, quando o netcat morre as coisas do systemd, o processo / bin / sh ainda está em execução. Nota: o URL está intencionalmente incorreto para testar

logentries.service - Push journal logs to logentries.com
   Loaded: loaded (/etc/systemd/system/logentries.service; disabled)
   Active: active (running) since Mon 2014-07-28 17:12:04 UTC; 1min 48s ago
 Main PID: 16305 (sh)
   CGroup: /system.slice/logentries.service
           ├─16305 /bin/sh -c journalctl -o short -f | awk -v token=token_here '{ print token, $0; fflush(); }' | ncat --ssl --ssl-verify -vv ogentries.com 20000
           ├─16306 journalctl -o short -f
           └─16307 awk -v token=80b4b3b6-1315-4b76-ac69-f530c1dec47f { print token, $0; fflush(); }

Jul 28 17:12:04 ip-172-31-19-155.us-west-2.compute.internal systemd[1]: logentries.service holdoff time over, scheduling restart.
Jul 28 17:12:04 ip-172-31-19-155.us-west-2.compute.internal systemd[1]: Stopping Push journal logs to logentries.com...
Jul 28 17:12:04 ip-172-31-19-155.us-west-2.compute.internal systemd[1]: Starting Push journal logs to logentries.com...
Jul 28 17:12:04 ip-172-31-19-155.us-west-2.compute.internal systemd[1]: Started Push journal logs to logentries.com.
Jul 28 17:12:04 ip-172-31-19-155.us-west-2.compute.internal sh[16305]: Ncat: Version 6.40 ( http://nmap.org/ncat )
Jul 28 17:12:04 ip-172-31-19-155.us-west-2.compute.internal sh[16305]: Ncat: Could not resolve hostname "ogentries.com": Name or service not known. QUITTING.
    
por DDRBoxman 24.07.2014 / 00:46

2 respostas

3

Comutado de pipes para substituição de processos.

link

link

Aqui está o arquivo de unidade que eu criei:

logentries.service

[Unit]
Description=Push journal logs to logentries.com
After=systemd-journald.service
After=systemd-networkd.service

[Service]
Restart=always
RestartSec=30s
ExecStart=/bin/bash -c "ncat --ssl --ssl-verify data.logentries.com 20000 < <(awk -v token=token_here '{ print token, $0; fflush(); }' < <(journalctl -o short -f))"

[Install]
WantedBy=multi-user.target
    
por 28.07.2014 / 19:53
1

Você tentou usar || /bin/true para retornar o status de saída zero em seu comando para evitar que o systemd detecte o status de saída incorreto?

journalctl -o short -f | awk -v token=$token '{ print token, $0; fflush(); }' | ncat --ssl --ssl-verify data.logentries.com 20000 || /bin/true
    
por 28.07.2014 / 16:06