Perguntas sobre 'hadoop'

O Apache Hadoop é uma estrutura de software que suporta aplicativos distribuídos com uso intensivo de dados sob uma licença gratuita. Ele permite que os aplicativos trabalhem com milhares de computadores independentes e petabytes de dados. O Hadoop foi derivado dos documentos MapReduce e Google File System (GFS) do Google.
0
respostas

cluster ambari + como definir o RAID em partições de máquina master

Queremos definir a configuração RAID em nossas máquinas masters (configuração de espelho de disco definido) Temos 3 máquinas masters (enquanto servidor ambari instalado na máquina master02) cada máquina master tem 3 partições uma partição...
09.12.2017 / 23:40
1
resposta

O datanode HDFS usa todo o espaço disponível

Eu tenho um disco rígido de 1TB (931GB utilizável) que dediquei ao HDFS. Eu montei em / hdfs. Aqui está o meu hdfs-site.xml <configuration> <property> <name>dfs.replication</name> <value>1</value>...
06.09.2017 / 23:51
1
resposta

Permissão SSH negada do Linux para o Windows usando chaves

Sou iniciante no hadoop e estou tentando configurar o cluster hadoop no modo de distribuição total. Meu mestre é o windows e minha máquina escrava é o Linux rodando na VM. Eu criei chaves SSH e em ambas as janelas e linux e copiei a chave públic...
03.03.2016 / 08:48
1
resposta

Copie os arquivos mencionados na Lista um por um somente após a conclusão

Eu tenho uma lista de nomes de arquivos em um arquivo de texto files.txt que são listados um por um na próxima linha, ou seja, file1.txt file2.txt file3.txt file4.txt ... ... ... Eu tenho que executar o seguinte comando para cada arqui...
04.02.2016 / 14:25
2
respostas

O Hadoop se beneficiará de apenas um disco?

Se eu usar uma configuração de nó único com Hadoop , onde tem apenas um disco, posso usá-lo facilmente para brincar com Hadoop e outras coisas, mas haverá realmente algum benefício em usar Hadoop neste caso sobre outro paradigma (process...
23.05.2015 / 20:47
1
resposta

Saída do Hadoop durante a execução - Qual é o número logo após o timestamp?

Quando o Hadoop é executado, ele exibe as mensagens que todos nós já vimos muitas vezes. Por exemplo: 2015-03-30 10:09:08,750 [main] WARN org.apache.hadoop.conf.Configuration - dfs.data.dir is deprecated. Instead, use dfs.datanode.data.dir 2...
30.03.2015 / 16:30
1
resposta

ERRO: Não é possível obter o endereço principal do zookeeper; dados do znode == null

Eu tenho two linux a máquina um é master machine(192.168.8.174) e outra é slave1 machine(192.168.8.173) . Eu instalei e configurei Hadoop 2.6.0 no modo totalmente distribuído com sucesso. A saída do Hadoop também vem perfeitamente. Eu...
21.03.2015 / 03:04
1
resposta

Erro de permissão negada (publickey) ao usar scp

Eu criei 3 instâncias do Linux na nuvem do Amazon EC2 sem uma frase secreta para a chave privada. Eu tinha armazenado a chave privada em um arquivo id_rsa em uma das minhas instâncias (o mestre) para permitir que ele fizesse ssh nos escravos. Es...
08.11.2014 / 19:09
0
respostas

Como instalar o Mahout no Windows 8.1?

Meu objetivo é criar um sistema de recomendação e depois de passar por muitos artigos, deparei com o Mahout como uma maneira simples, mas eficaz de continuar. Eu já tenho o XAMPP instalado no meu sistema. Como posso instalar o Mahout? Eu...
30.12.2013 / 10:43
0
respostas

Falha ao definir permissões do caminho: .. \ taskTracker \ cyg_server para 0700

Durante a execução de um trabalho no Cygwin no cluster do Hadoop, a permissão falhou. $ bin/hadoop jar hadoop-examples-*.jar wordcount inputwords outputwords2 Patch for HADOOP-7682: Instantiating workaround file system 13/09/19 16:37:39 INFO...
17.09.2013 / 09:39