Eu descobri a causa real do problema há algum tempo e imaginei que deveria documentá-lo aqui para outros que possam ter problemas semelhantes. A causa raiz acabou por ser mais complicada e complicada do que eu esperava inicialmente.
Em suma, run-parts
estava funcionando bem o tempo todo. Seu descontrole foi apenas o sintoma de um problema diferente. A cadeia de falhas parecia algo assim:
1) Em uma máquina totalmente diferente , o lsyncd
(um utilitário de sincronização de arquivos baseado em rsync
) estava funcionando mal por razões além da nossa preocupação aqui. Porém, nossa preocupação é que lsyncd
estava tentando sincronizar arquivos contra essa micro instância (que manifestou os problemas) pelo SSH.
2) Como o lsyncd
estava realizando dezenas de conexões simultâneas em SSH, cada uma aparentemente estava sendo saudada com o banner de login do SSH landscape-sysinfo
O Ubuntu fornece por padrão. Isso explica o que é landscape-sysinfo
e porque é filho do SSH. Parece que run-parts
foi o culpado, mas na verdade a questão era que a máquina estava sendo bombardeada com conexões SSH.
3) Exacerbando o problema foi que esta é uma micro instância no EC2, e descobri que a Amazon limita drasticamente as micro-instâncias cujo consumo de CPU está constantemente acima de um certo limite. ( Para uma excelente explicação dos detalhes, consulte Divagações de Greg . Muito obrigado ao Greg por esse artigo!)
Assim, a máquina rodou devagar por alguns momentos enquanto estava sendo bombardeada com conexões SSH, e depois ficou inutilmente lenta após o início da aceleração.
Mistério solucionado!