hadoop fs -stat "%Y" "/path/*"
Produz timestamps de tudo em / path /. Use isso junto com um corte quanto ao que você considera muito jovem e você pode ter essa limpeza em um shell script iniciado pelo cron.
Isso pode ser mais inteligente do que analisar outras coisas produzidas pelo hadoop fs.