Sim, o pacote não está disponível no CRan aparentemente. No entanto, uma pesquisa rápida mostra a página inicial do Rhipe, com as instruções bem claras reproduzidas abaixo:
-
Instale o Hadoop
Antes de fazer qualquer outra coisa, é essencial garantir que o cluster no qual o RHIPE será instalado tenha um cluster do Hadoop em funcionamento. RHIPE trabalha com o Apache Hadoop 1.0.x (0.20.x)
A seguir estão as referências úteis sobre a instalação do Apache Hadoop em um único e cluster de vários nós . Como alternativa, pode-se desejar ter uma instalação mais simplificada, o que pode ser feito com o gerenciador de instalação da distribuição do Cloudera .
É bom garantir que o Hadoop funcione antes de instalar o RHIPE. Um teste simples é executar um exemplo de trabalho e ver se ele é concluído sem erros. Para executar um exemplo mínimo, execute o seguinte no diretório hadoop (assumindo a versão hadoop 1.0.3).
hadoop jar hadoop-examples-1.0.3.jar pi 10 100
-
R deve ser instalado como uma biblioteca compartilhada, não incluirei os detalhes, pois você provavelmente já o instalou. Veja o link do Rhipe acima para mais informações.
-
Instalar buffers de protocolo
wget http://protobuf.googlecode.com/files/protobuf-2.4.1.tar.gz tar -xzf protobuf-2.4.1.tar.gz cd protobuf-2.4.1 ./configure # --prefix=... make make install
-
Configurar variáveis de ambiente
PKG_CONFIG_PATH: certifique-se de que isto contenha um caminho para onde os arquivos protobuf * .pc estão localizados.
LD_LIBRARY_PATH: aponta para o caminho onde R.so e Rhipe.so estão localizados (tipicamente algo como PREFIX / lib64 / R / lib).
HADOOP: aponta para o diretório de instalação do Hadoop. Espera-se que $ HADOOP / bin contenha o hadoop do shell do Hadoop.
-
Instale o Rhipe
wget http://ml.stat.purdue.edu/rhipebin/Rhipe_0.73.1.tar.gz R CMD INSTALL Rhipe_0.73.1.tar.gz