Eu estou em uma equipe de pesquisa de supercomputador em uma pequena universidade. Parece que não encontramos onde o rolo CUDA está instalado no nosso cluster Rocks, e temos certeza de que nunca foi instalado corretamente. Nós temos o iso do rolo. Ao pesquisar como reinstalar um rolo, o único método de instalar um único rolo novo que meus colegas devem criar um rolo de restauração e reinstalar o frontend com o rolo de restauração e quaisquer novos rolos. Existe alguma maneira melhor que estamos perdendo? O cluster que temos não pode ser removido por um período prolongado, como uma classe precisa para atribuições em andamento.