Eu finalmente descobri a resposta para esse problema.
Analisando dmesg
logs, percebi que, em alguns casos, as entradas SSD tinham uma cadeia hexadecimal diferente, dependendo do motor ao qual eu estava conectado.
Como estávamos produzindo imagens desses mecanismos com uma partição de tamanho padrão, eu não havia percebido, mas alguns dos mecanismos tinham SSD's Sandisc U100 de 64GB e alguns tinham drives de 32GB.
Apenas as versões de 64GB estavam sofrendo pânico no kernel. Então eu não sei se foi um problema com o nosso kernel, ou com o firmware do SSD, ou o que, mas nossa solução agora é definitivamente hardware e nós podemos trocar as unidades e fazer tudo feliz.