De longe Flume é uma alternativa melhor ..
O Flume é um serviço distribuído, confiável e disponível para coletar, agregar e mover com eficiência grandes quantidades de dados de log.
Flume fornece
- Escalabilidade contínua e de alto desempenho
- Carregamento confiável de dados e monitoramento do fluxo de dados dos feeds
- Registrando-se diretamente no HDFS com segurança (feito para o hadoop)
- Confiabilidade flexível em todo o sistema de mensagens (nunca perca uma mensagem)
- Vários tipos de fontes / coleções (executando em uma porta / logging do Apache / Syslog de forma segura)
- Robusto e tolerante a falhas com mecanismos de confiabilidade ajustáveis
- Mecanismos de failover e recuperação
O escrevente fornece "um pouco" confiabilidade, mas não tão abrangente ou flexível. em segundo lugar, sua compilação e usabilidade são difíceis em comparação com o flume ..
Espero que isso ajude: D