Eu não usei o PBS por um tempo, apenas o SGE, então essas respostas podem ser um pouco centradas no SGE.
A razão para usar um sistema de filas é utilizar melhor seus recursos. Se você tiver um cluster de 1000 nós e 100 usuários, não deseja que todos eles efetuem login e tentem executar o mpirun para usar todos os 1000 nós. Em vez disso, você permite que eles enviem trabalhos solicitando recursos (por exemplo, 10 a 20 CPUs, 4 GB de memória e assim por diante) e o sistema de filas cuida do envio de trabalhos em máquinas disponíveis. Além disso, se você não tiver tantos usuários e esse grande cluster, talvez você tenha 100 trabalhos que precisa executar. Basta enviar todos eles para o sistema de filas, deixá-los trabalhar em segundo plano, durante a noite e no fim de semana, e todos os seus recursos serão usados de maneira eficiente. Uma coisa legal que você pode fazer é permitir que o sistema de filas inicie e pare suas máquinas, dependendo da demanda, de modo que, se você não tiver nenhum trabalho, ele desligará seus nós e, quando enviar trabalhos, ele iniciará a quantidade certa de máquinas. Poderia economizar muito poder!
O script está sendo executado da mesma forma que se você o iniciasse manualmente, ele só tem um ambiente que sabe quais nós devem ser usados, em qual diretório deve ser executado e tal. Se você realmente deseja que os trabalhos sejam executados em segundo plano, inicie-os com um & no final, mas lembre-se de esperar pela execução de trabalhos no final, caso contrário, você poderá obter uma falta de correspondência entre os recursos que seu sistema de filas conhece e os recursos reais disponíveis.