DFSR (Distributed File System Replication) entre o Server 2008 e o Server 2008 R2 via Gateway para Gateway VPN, causando extrema latência de rede

2

A empresa em que trabalho está no processo de criação de uma filial para um de nossos clientes. Temos T1s de 1,5 Mbps para cima / baixo em cada local, um roteador Cisco RV042 em cada local que hospeda um gateway para o túnel Gateway VPN entre os dois locais e temos um servidor SBS 2008 no escritório principal e um servidor Server 2008 R2 Standard em a filial. Temos o DFSR configurado para replicar compartilhamentos específicos entre os dois escritórios. Nós não estamos usando namespaces, apenas DFSR.

Nosso problema é que, quando o serviço DFSR é ativado no servidor de ramificação, a latência da rede aumenta em 100x a 200x. Eu medi a latência usando apenas um ping contínuo do meu laptop para um site externo. Com o DFSR desativado, a latência média é de aproximadamente 11,5 ms. Com o DFSR ligado, varia entre ~ 1100 e ~ 2500 ms. A agenda do DFSR é definida para nenhuma replicação das 6h às 18h de segunda a sexta e replicação completa em todos os outros horários. O aumento de latência ocorre mesmo quando a programação diz que não deve ocorrer replicação.

Como teste, mudei o agendamento de replicação de UTC para a hora local. Eu supus que o UTC consultaria e usaria o deslocamento UTC das fontes de hora locais. (Pensando nisso agora, eu não tenho idéia do porquê eu assumi isso.) Eu não vi nenhuma melhoria imediata, mas eu li várias postagens relacionadas ao DFSR antes de escrever esta questão, e agora, vários minutos depois, vejo essa latência caiu. Ping agora está relatando entre 300 e 400 ms e estou obtendo resultados "Ok" do teste de velocidade Speakeasy.net.

Então eu acho que isso se tornou uma questão de duas partes. Esse é o tipo de aumento de latência que eu esperaria ver com o DFSR? Se não, o que posso fazer para ajustar, ajustar ou depurar mais?

Obrigado pela leitura. Se alguma coisa não estiver clara ou se você quiser mais informações, por favor me avise.

    
por Strahn 03.12.2011 / 01:09

1 resposta

1

Você não deve ver nenhum aumento de latência durante as horas de folga, já que não há replicação. As chances são que você acabou de configurá-lo errado (o que você parece ter descoberto com o seu comentário UTC). Quando você faz alterações, as alterações não são aplicadas imediatamente. Eles precisam ser replicados para todos os membros, o que pode levar horas, dependendo da topologia do AD.

So I guess this has become a two part question. Is this the kind of latency increase I should expect to see with DFSR?

Durante o tempo em que a replicação é permitida, absolutamente. 1,5 Mbps não é nada e seus servidores podem saturar facilmente se houver uma quantidade substancial de dados para replicar.

If not, what can I do to further tweak, tune or debug it?

Verifique novamente sua configuração e use ferramentas como dfsdiag para ver se há um atraso ou outros problemas.

Nota: A medição da latência com ping não é realmente uma técnica de solução de problemas. Você deve estar monitorando em seus roteadores / switches em cada site. 1.5Mbps não é muito hoje em dia. É provável que o seu desempenho seja bastante fraco durante todo o dia, dependendo de quantas pessoas estão no seu escritório. Você deve fazer uma medição de linha de base ao longo de um dia normal nos roteadores e então comparar.

    
por 03.12.2011 / 01:42