pyspark
é uma ligação de python para o programa de ignição escrito em Scala.
Contanto que você tenha o Java 6+ e o Python 2.6+, é possível fazer o download de binários pré-criados para faísca a partir do download página. Certifique-se de que os programas java
e python
estejam no seu PATH
ou que a variável de ambiente JAVA_HOME
esteja definida. Siga estas etapas para começar;
-
Descompacte e mova o diretório descompactado para um diretório de trabalho:
% bl0ck_qu0te% -
Vincule a versão do Spark a um diretório
% bl0ck_qu0te%spark
: -
Edite
% bl0ck_qu0te%~/.bash_profile
usando seu editor de texto favorito e adicioneSpark
ao seuPATH
e defina a variável de ambienteSPARK_HOME
:
Agora você deve ser capaz de executar o pyspark executando o comando pyspark
no terminal.
Algumas referências: