Calcula a frequência de solicitações e o uso da largura de banda para recursos específicos (relacionados ao CDN)

1

No momento, estou analisando a viabilidade de usar um CDN no meu site (~ 2 milhões de visualizações de páginas por mês). No entanto, antes de olhar para os inúmeros pacotes disponíveis, faz sentido descobrir exatamente o que eu preciso, em vez de esfaquear no escuro com uma estimativa "dedo no ar".

Então, alguém sabe de quaisquer utilitários que serão capazes de extrair o volume de pedidos, etc, para recursos específicos (ou seja, * .css, * .js, * .gif etc etc) dos meus logs do servidor Web (Apache)? ou talvez em outro lugar).

Com essas informações, eu saberá quantos pedidos por segundo o CDN terá para suportar e, o que é mais importante, quanta largura de banda eu precisarei. A partir disso, poderei escolher o pacote CDN correto para minhas necessidades.

Obrigado antecipadamente

    
por MrEyes 07.12.2010 / 18:08

1 resposta

1

Correndo o risco de ir todo o UNIX-y,

egrep '\.css|\.gif|\.js' httpd.access | awk '{print $10}'| perl -n -e '$sum += $_ ; print "$sum\n" ;'| tail -1

adicionará todos os bytes fornecidos nas solicitações .css, .gif e .js e imprimirá o total. Se isso não funcionar para você, tente

egrep '\.css|\.gif|\.js' httpd.access | head

para garantir que esteja imprimindo apenas as linhas relevantes, então

egrep '\.css|\.gif|\.js' httpd.access | awk '{print $10}' | head

para garantir que esteja imprimindo apenas as contagens de bytes das linhas relevantes (deve ser o campo após o código de retorno HTTP), porque como a maioria dos hacks de texto do UNIX, este depende bastante do formato do arquivo que estamos operando em. Uma que você tem a contagem de bytes, a largura de banda é a contagem de bytes dividida pelo tempo entre a primeira e a última linha em httpd.access .

    
por 07.12.2010 / 18:24

Tags