O trabalho MapReduce é interrompido após 1 de 5 redutores concluídos no ambiente de nó único

1

Eu tenho apenas um Data Node no meu ambiente de desenvolvimento no EC2. Fiz um trabalho pesado de RM e em 6 horas notei que 100% dos mapeadores e 20% dos redutores terminaram (1 de redutor mostra 100% de competição, outros - 0%). Parece que o trabalho é pendurado entre 2 corridas de redutor. Não vejo erros nos arquivos de log.

O que pode ser?

P.S. Últimos registros de redutor acabado com sucesso:

2012-11-09 11:29:21,576 INFO org.apache.hadoop.mapred.Task: Task:attempt_201211090523_0004_r_000000_0 is done. And is in the process of commiting
2012-11-09 11:29:22,692 INFO org.apache.hadoop.mapred.Task: Task attempt_201211090523_0004_r_000000_0 is allowed to commit now
2012-11-09 11:29:22,719 INFO org.apache.hadoop.mapreduce.lib.output.FileOutputCommitter: Saved output of task 'attempt_201211090523_0004_r_000000_0' to /data/output/1352457275873/20121109-053433-common
2012-11-09 11:29:22,721 INFO org.apache.hadoop.mapred.Task: Task 'attempt_201211090523_0004_r_000000_0' done.
2012-11-09 11:29:22,725 INFO org.apache.hadoop.mapred.TaskLogsTruncater: Initializing logs' truncater with mapRetainSize=-1 and reduceRetainSize=-1
    
por Marboni 09.11.2012 / 18:21

1 resposta

0

O log do JobTracker contém a seguinte mensagem de aviso:

2012-11-10 00:00:01,911 WARN org.apache.hadoop.mapred.JobInProgress: No room for reduce task. Node tracker_p-10-0-0-148.liveperson.com:localhost.localdomain/127.0.0.1:35533 has 71983820800 bytes free; but we expect reduce input to take 98282873836

Não há espaço em disco suficiente para a execução da tarefa. Resolvido depois de aumentar o espaço livre.

    
por 12.11.2012 / 09:34