Excluindo o diretório temporário do HDFS

2

Existe uma maneira inteligente de excluir arquivos antigos do diretório hdfs / tmp? (Só para ter certeza, eu não estou falando sobre o unix FS / tmp)

    
por Istvan 09.08.2012 / 23:28

2 respostas

2

hadoop fs -stat "%Y" "/path/*" Produz timestamps de tudo em / path /. Use isso junto com um corte quanto ao que você considera muito jovem e você pode ter essa limpeza em um shell script iniciado pelo cron.

Isso pode ser mais inteligente do que analisar outras coisas produzidas pelo hadoop fs.

    
por 28.08.2012 / 17:00
0

Aqui está (o código fonte de) uma pequena ferramenta que faz o trabalho: link

Eu poderia escrever um por conta própria (ou portar o dado para o Python), então não preciso criar uma cadeia de criação para Golang na minha empresa.

E mais um para os usuários do Ruby: link

    
por 29.04.2015 / 16:49

Tags