Não tenho certeza de uma distribuição Linux independente, mas você pode obter uma VM com o Hadoop pré-instalado aqui:
Existe alguma distribuição Gnu / Linux que forneça por padrão uma instalação do Hadoop?
Não há distribuição GNO ou Linux com hadoop.
O que pode ser feito é usar caixas de proteção pré-configuradas da cloudera e hortonworks.
Em segundo lugar, o que seria ainda mais bom se você configurar um standalone em seu local. Embora isso seja muito cansativo pode ser, pois pode demorar muito do seu tempo. Mas, pela minha experiência, dá uma melhor compreensão do ecossistema.Existem vários tutoriais disponíveis para isso. Basta pesquisar bogotobogo no google. Gostei deste tutorial.
Além disso, uma vez que a implantação do hadoop é feita com sucesso, tente usar o Spark. É divertido e excelente aprendizado quando você vê seu poder de processamento.
Tudo de bom !!
Não há "distribuição" em si, mas você pode experimentar o projeto ambari. É um projeto do apache que é um conjunto de scripts automatizados e encanamentos relacionados para instalar e monitorar uma instalação do Hadoop. Você até consegue um gui baseado na web com ele que pode ser usado para monitorar sua instalação e reiniciar: interrompa serviços, etc. Ele permite que você faça uma instalação em cluster. Tente.