Eu tive o mesmo problema. Aqui está a solução.
OS - Ubuntu 14.04 de 64 bits
Java - OpenJDK 7
Hadoop - Hadoop 2.4.1
Etapa 1: crie um diretório hdfs para entrada: hadoop dfs -mkdir -p /usr/local/hadoop/input
Passo 2: agora cole o arquivo jar nesta pasta usando o comando hadoop.
hadoop dfs -copyFromLocal /home/hduser/Desktop/sample.txt /usr/local/hadoop/input
Etapa 3: Vá para a pasta $ HADOOP_HOME / share / hadoop / mapreduce no terminal.
cd $HADOOP_HOME/share/hadoop/mapreduce
hadoop jar hadoop-mapreduce-examples-2.4.1.jar wordcount /usr/local/hadoop/input/sample.txt /usr/local/hadoop/output
Aqui, a pasta / usr / local / hadoop / output será criada. Cada vez que você tem que dar um novo nome.
NOTA: você não pode simplesmente listar as pastas de entrada e saída usando ls
no terminal.
Etapa 4: para visualizar a saída, use isto:
hadoop dfs -cat /usr/local/hadoop/output/part-r-00000