Perguntas sobre 'hadoop'

O Apache Hadoop é uma estrutura de software que suporta aplicativos distribuídos com uso intensivo de dados sob uma licença gratuita. Ele permite que os aplicativos trabalhem com milhares de computadores independentes e petabytes de dados. O Hadoop foi derivado dos documentos MapReduce e Google File System (GFS) do Google.
2
respostas

RPC: Falha no mapeador de porta - Não é possível receber: errno 113 (Nenhuma rota para hospedar)

Estou tentando montar o hdfs em minha máquina local (Ubuntu) usando o nfs seguindo o link abaixo: - https://www.cloudera.com/documentation/enterprise/5-2-x/topics/cdh_ig_nfsv3_gateway_configure.html#xd_583c10bfdbd326ba--6eed2fb8-14349d04bee--...
28.06.2017 / 11:41
1
resposta

Quanto espaço para / home em um cluster de hadoop? [fechadas]

O que é um tamanho razoável para fornecer uma partição / home para 100 usuários em um cluster de hadoop? Suponha que uma zona de aterrissagem tenha sido fornecida para armazenar arquivos / dados para processamento no cluster, assim a partição...
30.08.2014 / 02:30
0
respostas

O comando “hdfs dfsadmin -report” falha porque “falhou ao conectar-se ao servidor”

Estou tentando configurar um cluster de vários nós do Hadoop de software livre. Eu tenho o Hadoop 3.0 instalado no namenode e no nó de dados. Ambos estão executando o Linux (SUSE e Ubuntu). Nenhum deles é o CentOS, RedHat ou Fedora. Eu tentei...
02.01.2018 / 17:41
1
resposta

Validate start-dfs.sh

Estou tentando configurar um cluster do Hadoop, em que master é meu laptop e slave é a caixa virtual, seguindo este . Então, eu fiz, do mestre : gsamaras@gsamaras:/home/hadoopuser/hadoop/sbin$ sudo ./start-dfs.sh Starting namenodes on [mast...
24.01.2016 / 01:50
1
resposta

EOF inesperado ao procurar correspondência '' '

Estou tentando configurar o hadoop usando o cygwin. É a primeira vez que uso o ambiente unix, mas ao configurar o hadoop-env.sh, recebo o erro EOF # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agre...
26.03.2016 / 13:41
1
resposta

Conectar Link Simbólico ao programa ou script que retorna um arquivo

Eu queria saber se posso fazer um symlink para um arquivo em um banco de dados. Este é um palpite, mas é possível interceptar o link-follow usando uma função C e então deixar a função retornar o arquivo em um fluxo. O Cygwin intercepta de...
27.12.2015 / 10:37
2
respostas

Configuração ideal de energia da CPU do BIOS para o desempenho do Hadoop?

Estou no processo de configurar um cluster do Hadoop e até agora foi incapaz de encontrar uma boa resposta para como configurar o poder da CPU na BIOS para Linux. Meu BIOS oferece várias opções em relação à potência da CPU. as principais cate...
05.09.2015 / 12:43
1
resposta

Falso erro iniciando o Hue

Eu instalei o Hue no CentOS 7 do repositório Cloudera CDH5. Ao iniciar, ele informa um erro: # systemctl status hue hue.service - SYSV: Hue web server Loaded: loaded (/etc/rc.d/init.d/hue) Active: failed (Result: resources) since sob...
26.11.2016 / 21:56
1
resposta

Instalando o Oracle JDK 1.7 - erro 404

Estou tentando instalar o Hadoop 2.7.3. no Elementary OS (que ~ Ubuntu, eu acredito) seguindo as instruções no BUILDING.txt que veio com os arquivos do Hadoop. O arquivo indica que preciso instalar o Oracle JDK 1.7 seguindo as etapas a segu...
26.05.2017 / 21:02
1
resposta

Excluir arquivos 10 dias mais antigos do hdfs

Estou escrevendo um script ksh para limpar diretórios e arquivos hdfs com pelo menos 10 dias de vida. Eu estou testando o comando de exclusão em um terminal, mas ele continuou dizendo que está errado: $ hdfs dfs -find "/file/path/file" -depth...
25.11.2016 / 16:09