Por que esse status da pasta replicada do DFS é "não inicializado" e como resolvo isso?

3

Temos uma infraestrutura DFS com 3 servidores e 93 pastas replicadas. Quando executo um relatório de integridade no console de Gerenciamento DFS, o status de uma dessas pastas é listado como "não inicializado". Esta pasta foi previamente replicada normalmente.

A reinicialização de todos os 3 servidores DFS resolve o estado "não inicializado" e a pasta parece começar a replicar normalmente. No entanto, ele voltará a um estado "não inicializado" rapidamente, geralmente dentro de uma semana.

Tenho monitorado essa pasta no DFS e parece que um grande número de alterações atingirá essa pasta em períodos muito curtos de tempo - ou seja, o backlog de replicação aumentará para mais de 100.000 entradas no início da manhã durante o dia da semana . Normalmente, o atraso cai rapidamente nas próximas horas, então não me preocupei com isso.

No entanto, esse status de "não inicializado" agora significa que nenhuma replicação está ocorrendo nos servidores em que a pasta possui esse status. O que significa que agora temos um problema. Eu não rastreei arquivos ou causas específicas, mas enviei perguntas para a equipe de desktop para ajudar a identificar o que está causando o backlog.

Não encontrei nenhum erro de log de eventos relacionado a esta pasta ou status. Eu pensei que talvez o alto número de alterações de arquivo no volume pode estar causando erros de quebra de diário, mas eu não encontrei nenhum log de eventos relacionado ao quebra automática de diário USN. A pasta tem violações de compartilhamento consistentes, mas todas elas acabarão se resolvendo assim que os arquivos forem fechados antes desse problema "não inicializado".

Minha pesquisa mostrou-se nula, exceto pela possível corrupção do xml de configuração, mas nesses casos o problema era apenas com a replicação sysvol.

Minha única hipótese é que o DFSR está automaticamente definindo o status como "não inicializado" quando o número de diferenças ultrapassa um determinado limite. Mas eu não sou capaz de testar essa hipótese e não consigo encontrar nenhuma documentação para fazer o backup. E mesmo que seja verdade, eu não sei como eu iria "reinicializar" a pasta.

Os servidores envolvidos são:
A: servidor de envio, 2008r2, cota de armazenamento 25 GB, status: normal
B: servidor de recebimento, 2008r2, cota de preparo 175 GB, status: não inicializado
C: servidor de recebimento, 2012r2, cota de armazenamento 25 GB, status: normal

Todos os três servidores estão desempenhando um papel duplo como controladores de domínio do AD. Todas as 93 pastas replicadas estão no mesmo grupo de replicação, portanto, excluir e recriar o RG seria proibitivo no tempo. Quando esse problema ocorreu pela primeira vez, um pequeno número de outras pastas também mostrou esse status, mas somente essa pasta teve o problema recorrente após a reinicialização. A pasta afetada tem 202 GB de tamanho com 547.252 arquivos.

O que está fazendo com que a pasta seja "não inicializada" e como resolvo isso?

-Editar Mais algumas informações. O servidor de recebimento reinicializou a meia noite de ontem (~ 36 horas atrás). Isso trouxe a pasta para o status "Normal" e um backlog começou a gerar. Quando eu chequei ontem, o backlog nesta pasta era de 205.662 arquivos. Quando chequei hoje, o backlog é de 579.447 arquivos. A pasta atualmente possui apenas 551.706 arquivos. O backlog é maior que o tamanho da pasta. O relatório de integridade do DFS diz que 851.592 arquivos foram recebidos nessa pasta. Até agora, nenhuma outra pasta está tendo problemas como esse.

Não sei se o backlog está causando falha na replicação ou se a replicação está falhando e causando o backlog, ou se há algum banco de dados subjacente ou corrupção de log de diário causando a replicação com falha e um backlog. Nem sei como resolver o problema em nenhum dos casos.

Neste momento, há um único grupo de replicação para 93 pastas. Estou prestes a explodi-lo e configurar 93 grupos de replicação. Se isso não resolver o problema, pelo menos, será mais fácil solucionar problemas.

    
por Thomas 28.12.2016 / 23:21

0 respostas