O arquivo de log (erro) é o único lugar onde o Bind registrará tais erros, portanto, se você não quiser analisar os arquivos de log em busca de erros específicos (embora possa usar algo como o Splunk para automatizar essa análise e geração) alertas relevantes) você precisa de algo mais.
Do ponto de vista do monitoramento, acho que seu foco em ser notificado sobre erros durante as transferências de zona não é o bastante. Não são realmente os erros que importam tanto, é o fato de tais erros indicarem um serviço reduzido, falho ou errôneo. Em vez disso, concentre-se no serviço.
Uma solução de monitoramento configurada corretamente detectará esse estado de serviço alterado e o alertará. Então seu engenheiro / operador pode facilmente procurar no arquivo de registro a causa relevante da redução / falha do serviço ...
Em um cenário mestre-escravo, seu monitoramento precisa garantir que:
- todos os escravos e os servidores de nomes principais respondem e retornam os dados da zona
- todos os escravos retornam dados que são consistentes com o mestre
Um bom registro DNS para monitorar uma zona seria o registro SOA, já que isso é algo que cada servidor de nomes deve sempre poder retornar para cada zona.
Segundo, o número de série no registro SOA deve informar se o escravo está sincronizado com o mestre. Se houver diferença nos números de série que podem ser causados pelo escravo ter perdido uma mensagem NOTIFY, mas se essa diferença estiver presente por mais tempo do que o intervalo de atualização SOA, um problema mais sério está à mão.