Pode haver boas informações de pessoas aqui, mas você também pode querer perguntar à comunidade científica, já que há palestras e cartazes sobre isso na reunião da AGU no outono a cada ano. Muito disso tem que lidar com o gerenciamento do fluxo de trabalho para dados de ciências da terra, que podem ter alguns requisitos mais rigorosos do que os esforços de previsão.
Eu sei que eu vi algumas apresentações sobre isso na última reunião, mas o novo sistema abstrato da AGU absolutamente suga para tentar passar por um grande número de resumos e / ou navegar pela disciplina. (e sub-disciplina? não é uma chance).
Algumas pessoas estavam usando sistemas de gerenciamento de fluxo de trabalho (por exemplo, Kepler e Taverna ), mas eu não acho que eles tenham entrado no sistema aspectos de proveniência quase tanto quanto o cluster e o cluster de computação. Até mesmo as pessoas da ciência da terra, que pareciam estar tomando a origem mais a sério do que outros campos, pareciam ainda mais focadas em entradas de dados do que no tipo de processador / SO / versões de bibliotecas instaladas / etc.
Os termos usados para descrever o campo estão em todo o lugar - eu vi isso chamado de "infra-estrutura cibernética" (principalmente algo da NSF), "ciência da informática", etc. Desculpe, não posso ser mais específico, como este não é bem o meu campo. reclamar para esse tipo de coisa, sim, mas eu lido com os dados de serviço bem depois de ter sido gerado).