Perguntas sobre 'hadoop'

O Apache Hadoop é uma estrutura de software que suporta aplicativos distribuídos com uso intensivo de dados sob uma licença gratuita. Ele permite que os aplicativos trabalhem com milhares de computadores independentes e petabytes de dados. O Hadoop foi derivado dos documentos MapReduce e Google File System (GFS) do Google.
2
respostas

O hadoop cuida apenas do tamanho do HD do nó diferente?

Eu tenho um único nó (configuração pseudo-distribuída) e estou pensando em adicionar um segundo nó escravo. Importa se o escravo tem menos capacidade HD? O reequilíbrio levará isso para si? Eu não sou um especialista em HADOOP, de longe.     
07.05.2011 / 00:00
1
resposta

Instalação do Hadoop em várias instâncias do Ubuntu 10.04.1 em execução no VMware Workstation

Eu quero aprender sobre o Hadoop e executar algumas tarefas na computação distribuída fazendo algumas programações. Eu tenho um PC com o Windows 7 Professional instalado. No mesmo PC, eu também tenho um Ubuntu 10.04.1 instalado no VMware Work...
24.08.2010 / 19:10
0
respostas

Exemplo de saída de rúmen ou entrada para o Gridmix

Eu quero ver os registros do JobHistory, que podem ser alimentados como entrada para o Rúmen . Mais especificamente, estou interessado em saber o formato de entrada para o Gridmix . Eu tentei seguir duas coisas para isso: 1) Eu encontrei...
06.04.2018 / 22:24
1
resposta

Utilizando atributos posix em vez de LDAP normal?

Devido à forma como um software que usamos interage com o Unix, quando estou configurando um determinado aplicativo para interagir com o LDAP, eu preciso usar atributos Posix em vez de atributos LDAP normais. Até agora, tudo que descobri é qu...
23.03.2018 / 14:33
0
respostas

dose cluster ambari precisa de acesso ssh entre a máquina ambari-server para todos os outros hosts

Instalamos o cluster ambari com 3 máquinas de mestres Enquanto servidor ambari instalado no master02 linux machine O cluster ambari também inclui 25 máquinas DataNodes e 5 máquinas kafka dose ambari-server precisa de acesso ssh a todas...
21.12.2017 / 17:14
0
respostas

CDH Community Edition Upgrade de 5.7 para 5.13 sem o Cloudera Express ou o Cloudera Enterprise

Estou tendo um cluster como abaixo - 3 Hbase Master (1 ativo e 2 em espera) 4 servidores regionais 4 nós de dados 1 Primário e amp; 1 Nó de nome secundário 3 Nó do diário 4 Nodemanager 3 Gerenciador de recursos (1 ativo e 2 em es...
06.12.2017 / 10:41
0
respostas

Como evitar execução executável arbitrária no cluster hadoop

Estou envolvido na configuração de um cluster do Hadoop para auditoria e segurança completas. Eu sou novo no ecossistema Hadoop, mas tenho uma ideia decente do básico. Tenho algumas preocupações pelas quais espero que alguém possa me apontar na...
15.11.2017 / 17:50
2
respostas

Como identificar e corrigir blocos ausentes relatados pelo Ambari para o NameNode?

O Ambari está gerando um alerta NameNode Blocks Health: Total Blocks:[38252543], Missing Blocks:[2] . Nenhuma informação adicional. Eu executei hdfs fsck / , que está relatando todo o sistema de arquivos como saudável. Eu executei hdfs d...
26.09.2017 / 19:28
0
respostas

Os logs do YARN AM relatam um registro de data e hora diferente do que é mostrado no terminal e no shell sparkscala

Estou tentando entender por que ocorreu o seguinte: Eu tenho um contêiner do Docker com o Yarn e o Spark funcionando bem, exceto que o timestamp desse contêiner era menos X horas do que eu queria que fosse. Então, quando eu estava executando...
23.08.2017 / 01:14
0
respostas

Precisa definir a permissão 000 para o bloco de dados hdfs específico por meio da linha de comando

Estou tentando definir a permissão "000" para o bloco específico. Eu usei o comando abaixo para encontrar as informações do bloco: su - hdfs -c "hdfs fsck -locations -files -blocks /user/rohit/partition_filter_table/india.25.20.101.95000"...
19.10.2016 / 11:22