Como determinar as contagens de usuários simultâneas dos logs do apache

3

Temos três meses de registros do Apache e precisamos determinar qual é o número máximo de conexões simultâneas que recebemos.

Eu usei AWStats e não acho que isso é algo que gera. Existe outra ferramenta que nos dará esse tipo de informação dos logs?

    
por ShaneC 19.11.2010 / 17:50

3 respostas

1

Você não pode fazê-lo com os formatos de log comuns ou combinados padrão sem associar algumas suposições. Por exemplo, se você assumir que todas as suas respostas levam 500 ms, você pode obter o número de linhas de registro por segundo e dividir pela metade.

O que provavelmente seria mais fácil é usar algo como munin ou cacti para pesquisar os valores de mod_status. Ou você pode assistir à saída do netstat para algumas dúzias de amostras nos próximos dias e usá-la para estimar uma taxa aproximada de conexões simultâneas para o tráfego do seu site.

    
por 19.11.2010 / 17:57
0

Você pode ver a saída de netstat -n -t ao longo do tempo. O número de conexões ESTABLISHED na porta 80 é o número atual de conexões simultâneas (aproximadamente). Existem várias ferramentas que coletarão esse tipo de dados para você; nós usamos o Ganglia, que lhe dará uma variedade de estatísticas de rede se você usar o módulo "tcpconn".

    
por 19.11.2010 / 18:04
0

Não que eu saiba - a melhor solução seria pesquisar o netstat ou observar o status do servidor, no entanto, isso não é muito conveniente para dados históricos.

Se você só tiver os arquivos de log padrão, também não há muita informação (a menos que seu site seja sempre muito, muito, MUITO lento), mas você poderia pelo menos tentar calcular uma estimativa de conexões simultâneas. Você precisaria ordenar o arquivo por% t e passar por cada registro resolvendo a sobreposição. Não é um pouco trivial de código.

Uma abordagem mais simples que você poderia simplesmente olhar para o número de acessos por hora, multiplicar pelo tempo médio de resposta, em seguida, dividir pelo número de segundos em uma hora. É claro que isso pressupõe que todas as solicitações estão uniformemente espaçadas - mas você pode calcular um fator de escala (medindo o número atual de conexões, conforme descrito acima). Mas, claro, se você está gravando apenas% T (em vez de% D), o arredondamento irá destruir qualquer tipo de precisão em sua estimativa (novamente, a menos que seu site seja terrivelmente lento).

    
por 19.11.2010 / 18:06