Isso já foi discutido, mas já se passaram vários meses, então talvez seja hora de revisitá-lo:
Discussões anteriores RE Alternativas de Splunk
Para o registro, o Splunk balança. Mas o preço é simplesmente além do que podemos considerar (quando falei com a Splunk hoje, o custo de um sistema para indexar 5GB / dia de dados é superior a US $ 30.000.)
Isso é mais do que gastamos no SQL Server (por um grande múltiplo), mais do que gastamos em um rack de servidores (por vários), etc. etc.
A equipe de vendas do splunk está correta (que por US $ 30 mil temos mais valor e funcionalidade do que se gastarmos o mesmo prédio em nosso próprio sistema), mas isso não importa. O custo do splunk é simplesmente alto demais (por um múltiplo).
Soooooo, estamos olhando em volta!
Alguém aí está construindo um sistema parecido com o splunk?
Nossa necessidade básica:
- Capaz de ouvir mensagens do syslog em várias portas do udp
- Capaz de indexar os dados recebidos de maneira assíncrona
- Algum tipo de mecanismo de pesquisa
- Algum tipo de interface de usuário
- Uma API para o mecanismo de pesquisa (para incorporar em nosso console)
Atualmente, precisamos indexar de 3 a 5 gb / dia, mas precisamos escalar até 10 gb / dia ou mais. Nós não precisamos de muita história (30 dias é bom).
Utilizamos servidores Windows 2008 e 2003.
Obrigado por seus pensamentos!
UPDATE : passamos duas semanas pesquisando opções comerciais e de código aberto. Nossa conclusão: Escreva o nosso próprio (somos uma empresa de software ... sabemos como escrever coisas). Nós construímos um ótimo sistema baseado em mongodb e .NET que nos fornece as funções que precisamos do MongoDB em cerca de uma semana de engenharia. Agora concluímos nossa implementação. Usamos dois servidores Mongodb (master e slave), e podemos registrar e indexar qualquer quantidade de dados de log (5gb / dia, 15gb / day, etc), limitada apenas pelo espaço em disco.
ATUALIZAÇÃO PARA A ATUALIZAÇÃO (dezembro de 2012) : Continuamos a usar nossa solução mongodb e ela funciona muito bem! Se a construíssemos hoje, consideraríamos strongmente construí-la em cima da elasticsearch.
OBSERVAÇÕES : esse espaço precisa de uma solução sólida que seja de US $ 1.000 a US $ 3.000,00. Os modelos de licenciamento utilizados pelas firmas comerciais baseiam-se em modelos do tipo "ordenham o processamento de data centers". Esse é o seu direito (claro!), Mas deixa um espaço enorme para alguém entrar embaixo deles. Meu palpite é que em mais um ano ou dois haverá uma boa solução de código aberto que será realmente utilizável.
Obrigado a todos por sua contribuição (mesmo que tenha sido auto-promoção).