Alta latência esporádica na minha rede doméstica

1

tl; dr Minha rede doméstica recentemente passou por saltos de 27ms para 600ms. Isso não acontece sempre e parece ocorrer frequentemente à noite. Que equipamento devo comprar e testar devo executar para deduzir a causa?

Configuração

Minha casa tem DSL de 12Mb / 800kb. Eu moro nas montanhas, longe de outras fontes de Wi-Fi. Historicamente (por anos) eu consegui pingar google.com e obter ~ 27ms vezes. Se algo estava inundando a rede ou a conexão (um iPhone sincronizando todas as fotos com o iCloud), os pings saltariam para o intervalo de 2000-6000ms. Mas normalmente tudo estava bem.

Recentemente, no entanto, a rede permanece indexada em torno de 600ms por dezenas de minutos por vez. Não consigo encontrar nenhum dispositivo que esteja inundando a rede. (Pode existir, mas eu não o encontrei.) A conexão geralmente é completamente boa pela manhã, e geralmente persistentemente ruim à noite (apenas quando queremos transmitir shows na cama!)

Durante horários de alta latência, os pings para outros dispositivos na rede (alguns que eu tentei) permanecem inalterados (sempre < 2ms).

Solução de problemas com falha e confusão

Eu comprei todo o novo hardware (modem DSL, roteadores Wi-Fi, comutadores de rede) para descartar isso. O problema persiste. Aqui está a configuração:

EutenteiusaroModemDSLcomooroteador(PPPoE+DHCP+NAT)comasestaçõesbaseWi-Finomodobridge.EutenteicolocaroModemDSLnomododeBridgingtransparenteeteroprimeiroAirportExtrememanipulandoPPPoE,DHCPeNAT.Oproblemapersiste.

Desconecteitodasasconexõescomfio(deixandoapenasomodemDSLeaestaçãobaseWi-Fi).Oproblemapersiste.

EuuseiapenasoModemDSL(comPPPoE)euseioseupróprioWi-Fi.Oproblemapersiste.Eutenteiprocurartodosostabletsantigos,telefones,laptopsnoWi-Fiedesligá-los.Oproblemapersiste.EurenomeioSSIDWi-Fiecoloqueiumasenhanele,conectandoumúnicolaptopMacBookProviaWi-Fi.Oproblemapersiste.EuuseiumlaptopdiferenteporWi-Fi.Oproblemapersiste.

ConecteiumlaptopdiretamenteaomodemviaEthernet,comoWi-Fidesativadonomodemenadamaisconectado.Oproblemavaiembora!(Euachoque...poderia*serqueoproblemanãoestivesseseexibindonastrêsocasiõesemqueeutesteiisso.)

Emumponto,comapenasumlaptopconectadoviaEthernet,ligueioWi-Fiparaomodemeoproblemaseexibiu.AlatênciadepingsaltouimediatamenteassimqueligueioWi-Fi,emboraeunãoacreditequeosdispositivosestejamconectadosporWi-Fi.

Euusei iStumbler e não parece haver nenhuma correlação entre a latência ruim e o aumento do ruído. De fato, o SNR parece bem consistente com o Wi-Fi.

Lembre-se de que, quando as coisas estão ruins, elas não são SEMPRE ruins. Mesmo com todos os dispositivos da casa ligados e ligados, há momentos em que a latência cairá para 30ms ou mais por alguns segundos (ou minutos, ou horas) antes de ficar ruim novamente.

Próximos passos?

Eu acho que iStumbler me mostrou que o problema não está relacionado a problemas de RF. (Talvez eu esteja errado?) Então estou pensando que deve ser um tráfego real na rede.

A estação base Airport Extreme não suporta nenhum tipo de log SNMP. Nem o Actiontec C1000A. Eu não tenho um switch com uma porta de monitor ou um hub. Eu nunca usei o Wireshark antes.

MAS EU TENHO DISPENSA EM GANHAR DINHEIRO E TEMPO NESTE PROBLEMA PARA RESOLVÁ-LO

O que devo comprar? Onde devo injetar na minha rede? O que devo procurar? Como posso assistir a todos os pacotes na rede e construir histogramas e gráficos para determinar se um dispositivo ruim está arruinando a situação para todos?

Editar 1 : Estatísticas do DSL quando tudo está bem

+-----------------+-------------+
|   Connection    |   Status    |
+-----------------+-------------+
| DSL Downstream: | 15.869 Mbps |
| DSL Upstream:   | 0.896 Mbps  |
+-----------------+-------------+

Estatísticas de links DSL

+------------------------------+---------------------+
|        Link Statistic        |       Status        |
+------------------------------+---------------------+
| Broadband Mode Setting:      | Auto Select         |
| Broadband Mode Detected:     | VDSL2 - 8A          |
| DSL Link Uptime:             | 0 Days, 10H:39M:57S |
| Retrains:                    | 1                   |
| Retrains in Last 24 Hours:   | 1                   |
| Loss of Power Link Failures: | 0                   |
| Loss of Signal Link Failure: | 0                   |
| Loss of Margin Link Failure: | 0                   |
| Link Train Errors:           | 0                   |
| Unavailable Seconds:         | 23                  |
| Estimated Loop Length:       | 2250                |
| Uncanceled Echo:             | N/A                 |
| Transport Mode:              | PTM                 |
| Path Parameter:              | 201                 |
| Priority:                    | 0                   |
| Service Type:                | PTM-Tagged          |
+------------------------------+---------------------+

Potência DSL

+--------------+-------------------------+------------------------+
|    Levels    |       Downstream        |        Upstream        |
+--------------+-------------------------+------------------------+
| SNR:         | 16 dB                   | 10 dB                  |
| Attenuation: | (DS1)21.7, (DS2)58.8 dB | (US1)4.3, (US2)47.8 dB |
| Power:       | 16.4 dBm                | 7.8 dBm                |
+--------------+-------------------------+------------------------+

Transporte DSL

+----------------------+------------------+---------------+
|      Transport       |    Downstream    |   Upstream    |
+----------------------+------------------+---------------+
| Packets:             | 1482864          | 1088249       |
| Error Packets:       | 0                | 0             |
| 24 Hour Usage:       | 1225940.68 Mbits | 2420.93 Mbits |
| Total Usage:         | 1225940.68 Mbits | 2420.93 Mbits |
| 30 Minute Discarded: | 0                | 3930          |
+----------------------+------------------+---------------+

Canal DSL

+----------------+-------------+-------------+
|    Channel     |  Near End   |   Far End   |
+----------------+-------------+-------------+
| Channel Type:  | Interleaved | Interleaved |
| CRC Errors:    | 0           | 0           |
| 30 Minute CRC: | 0           | 0           |
| RS FEC:        | 5873        | 29          |
| 30 Minute FEC: | 372         | 0           |
+----------------+-------------+-------------+

Editar 2 : relatório do Bufferbloat do DSLReports

Executar o teste de velocidade durante a latência normalmente normal indica que o problema ocorre durante o upload

Pingvezesànoiteeduranteanoite

Opicoporvoltadas22h35eradeumcomputadorquecomeçavaafazerouploadparaoDropbox.

Editar 3 : o suporte técnico do ISP disse:

Modem is getting more signals that it is suppose to. If the cables are not enough to carry the load we are sending we can lower it down to 100%. To test this is for me to lower down the signal for 7 days and you can observe if the browsing \ internet is better. After 7 days our server would run test and would boost your signals up again. And by that time we would have enough figures what to do next.

Our server is provisioning you more than your purchase. Technically this should make the internet faster but if pings and delay that are caused by traffic are observed by the customer. We can bring it to the purchased speed\ signal and observe if the DSL line on the customers premise are cable to carry the load.

Actual/Provisioned/Purchased speeds
Down: 15868/15872/12128Mbps
Up: 896/896/896kbps

    
por Phrogz 19.10.2015 / 19:19

2 respostas

2

Algo errado. 24hr stats dizem:

312.600 MBytes para baixo 247,500 Mbytes para cima

Você não incluiu taxas de link, mas 8A a 2KM oferece talvez um link de 15/5. Aos 5Mb dos EUA, você só poderia fazer upload de cerca de 55GB / 24hrs. Mesmo a 10Mb você não chegaria a 250GB, então não confie nessas estatísticas.

Ainda assim, isso soa realmente como peer to peer / sync / malware em sua rede é auto-DOS.

ATUALIZAÇÃO:

Sua conexão é balanceada como uma conexão ADSL de estilo antigo (8D 0,5U, 12D 0,7U, 15D 1U) contra o que você normalmente faria com VDSL (2) (15D, 3U). Isso deixa você em uma situação onde é muito fácil congestionar seu próprio link.

Qualquer coisa que esteja em execução na sua rede pode causar uma fila upstream, na qual o modem contém uma série de quadros que estão tentando enviar, mas estão chegando mais rápido do que podem encaminhar. Assim, por exemplo, em vez de 1 ms do seu laptop para modem, 20ms do modem para troca, 5 ms de troca para site você tem: 1ms de você para modem, 100ms esperando no buffer de quadro, 20ms para trocar e 5ms para o site. Quanto mais isso for enviado, maior será o tempo de espera.

Coisas para procurar: Peer to Peer (bit torrent, lançadores de jogos) Sincronizando aplicativos: Windows 7/8/10 One Drive, Dropbox (esp Camera Sync), iCloud Backup offsite como Crashplan / Backblaze etc Aplicativos VoIP / Video Call: Skype, TS / Mumble

Qualquer coisa que envia dados para a web.

    
por 20.10.2015 / 15:38
1

Os sintomas relatados soam como um problema de bufferbloat, em que o roteador, o modem DSL ou o DSLAM do seu ISP armazenam muitos pacotes quando o link está congestionado, resultando em alta latência. Normalmente, o TCP procura por quadros perdidos como evidência de congestionamento e recua. Mas se o seu roteador ou modem ou DSLAM fizer um buffer para sempre e nunca permitir que um quadro caia, você acaba com enormes aumentos de latência, sem que o TCP tenha a chance de recuar para aliviar o congestionamento. Você nunca deve ter um enorme aumento de latência apenas porque sua largura de banda de upstream ou downstream está saturada. Se você faz, você quase certamente tem bufferbloat.

Execute a ferramenta de teste de velocidade dslreports.com . Ao contrário de outras ferramentas de teste de velocidade, essa ferramenta também mede e reporta problemas de bufferbloat, que podem causar alta latência sempre que algo estiver usando toda a sua largura de banda downstream ou upstream (como quando você decide transmitir vídeo à noite).

O fato de você já ter provado que sua latência sobe quando algo está usando toda a sua largura de banda de upload (seu exemplo de sincronização do iCloud Photo) é uma boa indicação de que você está sofrendo de problemas de bufferbloat.

O seu modem DSL é provavelmente a fonte de quaisquer problemas de bufferbloat upstream. Uma solução pode ser comprar um modem DSL conhecido por não ter problemas de bufferbloat. Eu não pesquisei esse mercado, então não posso ajudá-lo com nenhuma sugestão. Seu Google-fu provavelmente é tão bom quanto o meu.

Alternativamente, considere a compra de um gateway doméstico que possa rodar o CeroWrt, OpenWrt ou DD-WRT, todos agora com as tecnologias anti-bufferbloat, como FQ_CoDel, que foram pioneiramente desenvolvidas / desenvolvidas no CeroWrt. Usando uma caixa como essa para limitar artificialmente sua largura de banda de upstream e downstream para algo um pouco mais lento do que o seu link DSL é realmente capaz, e ter essa caixa dropar quadros e envia Explict Congestion Notifications (ECN) quando esse limite é atingido, em vez de buffering para sempre, ele permite que o TCP detecte o congestionamento e recue como o TCP deve fazer.

Você não precisa necessariamente dispensar seu modem DSL ou seu AirPort Extreme para instalar essa caixa * Wrt; você pode instalá-lo como uma caixa com fio entre o seu modem DSL e seu primeiro AirPort Extreme. Apenas certifique-se de que todo o tráfego de / para sua rede doméstica passe por essa caixa. Ou seja, certifique-se de que você não possui nenhum dispositivo conectado diretamente ao modem DSL além desta caixa *.

Se você sabe que tem bufferbloat, provavelmente deve eliminá-lo antes de procurar por outras fontes potenciais de picos de latência, caso contrário, isso atrapalha suas tentativas de encontrar outras fontes de latência.

    
por 19.10.2015 / 22:28