Até onde eu sei, o Cloudera Distribution for Hadoop 4 (CDH4) usa o Ubuntu. CDH4 vem com produtos Hadoop pré-instalados e configurados para desenvolvimento. Alguns dos produtos instalados são:
- Hadoop (HDFS e YARN / MapReduce)
- HBase
- Oozie
- Porco e amp; Colmeia
Você pode obter a VM e as instruções sobre como usá-la em aqui
Há também uma VM Qucikstart para CDH 5.4.x mas que roda no CentOS
Veja os links a seguir para mais informações:
link