Você pode querer parecer Ansible para o Gerenciamento de Configurações, já que ele usa o acesso SSH existente para acessar as máquinas.
Parece que, tanto quanto você precisa de uma solução de Gerenciamento de Configurações, você também precisa de uma solução de gerenciamento de orquestração / fluxo de trabalho para gerenciar sequências complexas de eventos, com detecção de falhas por etapa e paralelização em várias máquinas. Para isso, algo como Control / M, JBPM ou evento Concourse.ci seria útil.
Boa sorte para você e sua startup.