Perguntas sobre hadoop. Página # 12

O Apache Hadoop é uma estrutura de software que suporta aplicativos distribuídos com uso intensivo de dados sob uma licença gratuita. Ele permite que os aplicativos trabalhem com milhares de computadores independentes e petabytes de dados. O Hadoop foi derivado dos documentos MapReduce e Google File System (GFS) do Google.

resposta

Arquivo escravos Hadoop necessário?

Estou trabalhando em uma equipe que está tentando criar um sistema para criar clusters do Hadoop no EC2 com o mínimo de esforço por parte do usuário. Idealmente, gostaríamos que instâncias escravas exigissem apenas o nome do host da instância do...

21.02.2010 / 18:11

respostas

Erro de ignição: falha ao enviar RPC ao datanod

Temos poucos problemas com o nosso servidor Spark Thrift. É um novo cluster Ambari e nenhum trabalho do Spark está sendo executado agora. No log, podemos ver uma mensagem de erro: Failed to send RPC 9053901149358924945 to /DATA NODE MACHIN...

07.02.2018 / 17:35

respostas

Como posso iniciar o hdfs no Mesos sem o DC / OS?

Do meu entender, o DC / OS é um serviço gerenciado por Freemium. Porque eu prefiro apenas ter uma implementação do Mesos, eu prefiro não ser dependente do DC / OS e por isso eu só quero saber como implementar o HDFS no Mesos sem ele. Infelizm...

23.02.2017 / 21:10

resposta

Cluster do Hadoop baseado em Raspberry Pi [fechado]

É pelo menos possível construir um cluster do Hadoop a partir de nós baseados no Raspberry Pi? Esse cluster pode atender aos requisitos de hardware do Hadoop? E, em caso afirmativo, quanto os nós do Raspberry Pi são necessários para atender aos...

08.07.2012 / 13:57

resposta

Existe alguma maneira de usar matrizes em um módulo de fantoches (não no modelo)?

Eu quero usar o fantoche para gerenciar um cluster de hadoop. Nas máquinas, temos vários diretórios que devem ser criados e definir permissões. Mas não consigo adicionar valores de matriz para métodos definidos. define hdfs_site( $dirs ) {...

10.05.2010 / 15:09

respostas

O que significa “acesso a dados em fluxo contínuo” no HDFS?

De acordo com a página da Arquitetura HDFS, o HDFS foi projetado para "acesso a dados em fluxo contínuo". Não tenho certeza do que isso significa exatamente, mas acho que isso significa que uma operação como a de busca é desabilitada ou tem um d...

14.07.2009 / 10:13

respostas

Implantar o Hadoop no Openstack

Gostaria de implantar o Hadoop na nuvem do Openstack. Existe alguma maneira automática de fazer isso? Alguém tentou fazer isso? Eu estou procurando por alguns devops como juju. Eu nunca usei o juju e agora estou passando pelo tutorial do juju...

19.07.2012 / 12:43

resposta

Configurando a seção com hadoop

Estou tentando configurar a colmeia. Estou usando este guia: link e estou preso ao configurar / tmp e / user / hive / warehouse dirs. Primeiro de tudo, parece-me um pouco estranho que a colmeia precise alterar meu diretório / tmp para o HDFS....

24.04.2012 / 14:01

resposta

Executando o HDFS com apenas 1 nó de dados - o anexo falha

Estou tentando testar alguns serviços que exigem o HDFS usando o Docker Compose . Como os serviços que estão sendo testados, namenode e nó (s) de dados estarão todos em execução na mesma máquina física (laptop dev), seria interessante reduzir o...

04.10.2016 / 17:34

resposta

Grupo de superusuário do Cloudera Hadoop

Estou tentando criar um grupo em um dos meus datanodes que terá privilégios de superusuário para hdfs e comandos fs associados. Até agora eu tenho: Verificado para ver que dfs.permissions.superusergroup = supergroup (padrão) Criado u...

02.05.2014 / 19:22

Perguntas sobre 'hadoop'