N vezes por dia exibimos 10% de perda por minutos indefinidos, às vezes horas

4

Estamos gerenciando 350 servidores, em alguns gabinetes diferentes. Às vezes, por um certo período de tempo, perdemos 10% de pings e sessões com uma cabine inteira. É óbvio que não há problema com os servidores porque o problema começa com todos os servidores dentro do gabinete ao mesmo tempo e termina novamente ao mesmo tempo. (Estamos monitorando servidores com um servidor dedicado em um desses gabinetes)

Além disso, lemos 80 mbits de tráfego, o que acreditamos não ser natural. Mas, curiosamente, após a meia-noite, quando o tráfego deve ficar em torno de 20 mbits, lemos 80 mbits quando esse problema ocorre, e no meio dia lemos 80 mbits novamente quando esse problema ocorre quando o tráfego normal deve estar em torno de 60 mbits.

DCdizquenãoháproblemacomseuroteador,switch,etc.Elesdizemqueosservidorestêmproblemas,masquandoverificamososservidores,ascargasestãopróximasde0ou0,5.

Então,estamospresosaisso,elesnãoaceitamousequercomentamsobreesseproblema.Nósrealmenteprecisamosdepelomenosumcomentáriosobreissoeacreditamosqueesteéoverdadeirolugarparaestaquestão.Esperoquevocêatécomentesobreisso.

Atualização(15dejulho);AgoraDCmedisseque(eunãoseicomoéaexplicaçãoestúpidaque)ocabopodeserconectadoaportade100MBit.Eunãoseisealgumaportade100MbitsaiuemqualquerDC,masessaéasuaexplicação.Aquiestáonovográfico;

Muito obrigado

    
por Harun Baris Bulut 13.07.2013 / 00:54

1 resposta

2

É possível que um dos dispositivos conectados ao seu switch de rack tenha um NIC incorreto que fica intermitentemente chateado (e inunda o segmento com lixo). Como alternativa, é possível que possa haver um problema com o switch, apesar do que dizem os operadores do datacenter, e também pode ser possível que você tenha um cabo defeituoso.

Se possível, no momento em que ocorre uma perda alta de pacotes, verifique as luzes no interruptor. A maioria dos comutadores indicará uma anormalidade causada por um NIC defeituoso que está enviando tráfego ilegível (embora a maneira como eles fazem isso seja muito variável, geralmente a luz que indica que uma conexão irá piscar ou algo assim, mas em qualquer caso, será estranha) .

Também pode haver algo mais inundando muito tráfego; considere a execução do tcpdump ou algo para ver se há um DoS provável acontecendo. Eliminar pacotes durante o congestionamento da rede é um comportamento normal.

    
por 13.07.2013 / 04:24