O serviço Kerberos no win2k dc não será iniciado após falha de disco

3

Eu tenho um win2k (domínio de modo misto) com 4 DCS. Um deles também atua como um servidor Exchange 2000, que usa dois volumes lógicos de um array MSA 2000. AD etc é armazenado em unidades locais.

Tivemos um problema na semana passada, quando o RAID caiu para um controlador redundante e isso significava temporariamente que as duas unidades lógicas não estavam visíveis para o servidor por cerca de 5 minutos e algumas reinicializações. O log registra estes

Eventos como tipo: aviso Origem do evento: disco Categoria do evento: nenhuma ID do evento: 51 Data: 06/11/2009 Horário: 11:46:23 Usuário: N / A Computador: server1 Descrição: Foi detectado um erro no dispositivo \ Device \ Harddisk1 \ DR1 durante uma operação de paginação.

Após esses problemas, o serviço do servidor “kerberos Key Distribution” se recusa a iniciar com um “erro. 31 um dispositivo conectado ao sistema não está funcionando”. Todos os outros serviços de início automático (incluindo o logon de rede) estão em execução e não há problemas de DNS, etc.

Todos os dispositivos também estão funcionando, mas os dois discos lógicos MSA agora estão numerados no MMC de Gerenciamento de Disco do Windows como 2 e 4 e suspeito que eles possam ter sido identificados anteriormente como discos 1 & 2 e talvez o Windows ainda veja isso como uma falha contínua ??

A replicação não foi afetada, mas obviamente há muitas falhas de auditoria no log de segurança relacionadas a usuários e estações de trabalho presumivelmente vinculadas ao problema do Kerberos.

A tentativa de iniciar manualmente o serviço kerberos gera o seguinte no Registro do Sistema.

Tipo de evento: erro Origem do evento: Gerenciador de controle de serviços Categoria do evento: nenhuma ID do Evento: 7023 Data: 09/11/2009 Horas: 09:46:55 Usuário: N / A Computador: Server1 Descrição: O serviço Centro de distribuição de chaves Kerberos foi finalizado com o seguinte erro: Um dispositivo conectado ao sistema não está funcionando.

O DCDIAG passa em todos os testes, exceto "Publicidade" e "Serviços", que acredito que estejam relacionados diretamente ao fracasso do Kerberos apenas.

Qualquer conselho seria apreciado.

    
por Ryan Fisher 09.11.2009 / 14:07

1 resposta

4

Eu estou querendo saber se o GUID do volume mudou de alguma forma. O local do banco de dados do Active Directory é mantido no registro (consulte Mapeamentos de unidade HKEY_LOCAL_MACHINE \ SYSTEM \ CurrentControlSet \ Services \ NTDS \ Parameters \ DS). É tudo o que posso fazer: o que pode ter acontecido, e isso não é realmente uma "parte utilizável pelo usuário".

O que você está vendo me faz sentir falta de confiança na capacidade da máquina de operar de maneira adequada novamente. (Eu não confiaria nessa matriz de discos ou no controlador RAID mais longe do que eu poderia lançá-lo se ele fosse ativado e renumerasse os discos que ele apresenta para o Windows, mas isso é outra história.)

A restauração a partir do backup pode ser problemática se você continuar usando usuários do Exchange nessa máquina durante essa interrupção, pois mais dados estão sendo empilhados na caixa.

Eu abriria um computador temporário do Exchange Server em outra máquina, moveria todas as caixas de correio para esse servidor secundário, replicaria suas pastas públicas, OAB etc., para que você possa descomissionar o Exchange no servidor com falha corretamente. Você precisará deixar o servidor com falha em execução por tempo suficiente para que todos os usuários acessem suas caixas de correio no novo local uma vez, para que o Outlook atualize seus perfis MAPI para se referirem ao nome do servidor temporário.

Depois de fazer isso, eu reconstruiria o servidor com falha do zero, executando uma limpeza de metadados do NTDS, se necessário, se ele não fosse rebaixado para um servidor membro corretamente (consulte link ).

Depois de recriar a máquina, você poderá reinstalar o Exchange, mover as caixas de correio de volta, replicar pastas públicas etc. Novamente, você precisará deixar os computadores Exchange Server em execução até que todos os usuários acessem suas caixas de correio pelo menos uma vez para que seus perfis MAPI sejam atualizados e você possa descomissionar o computador temporário do Exchange Server.

    
por 09.11.2009 / 15:19