(a) é importante, mas não deve ser deixado como uma questão de processo para os seres humanos. Verificar se todas essas coisas estão acontecendo, com periodicidade apropriada, deve ser uma das funções do seu sistema de monitoramento.
(b) é o trabalho do software de backup. Lembre-se do princípio "um dado, um local"; Se o seu software de backup diz que uma fita está em um lugar, e seu outro processo interno diz que é em outra, em quem você acreditará? Se suas solicitações no local / fora do site forem geradas automaticamente (como deveriam), é útil manter cópias (suaves) delas; eles sempre podem ser usados como uma verificação de emergência de emergência da memória do software de backup.
(c) é também o trabalho do software de backup. Qualquer bom pacote de software terá o conceito de uma "bare metal restore" embutida, e isso deve incluir a restauração bare-metal do próprio servidor de backup. Meu software de backup preferido, bacula, detalha esta sua documentação , que pressupõe que tudo foi perdido, exceto a pilha de fitas de backup externas, e que você adquiriu hardware substituto. Ele diz quais ferramentas você usaria para indexar as fitas, como encontrar o backup de catálogo mais recente, como restaurá-lo em uma instância de bacula nova e vazia, e como você iria restaurar os clientes de lá.
Verifique se o seu software de backup também documenta isso. Teste se o procedimento funciona . Mantenha suas anotações desses testes.
Quanto a (d), acho que você já cobriu a maioria dos pontos importantes. O que eu reitero é que você deve testar suas restaurações frequentemente ; não apenas uma vez a cada seis meses, mas pelo menos uma vez por mês. Escolha um funcionário aleatório, pergunte a ele qual arquivo ele odiaria perder; verificar isso pode ser restaurado para sua satisfação. Pergunte a uma pessoa de TI aleatória qual servidor eles mais odeiam perder; restaurá-lo para outra caixa e tê-los verificá-lo para a funcionalidade. Teste seus procedimentos de DR a cada seis a doze meses, na íntegra. Sim, tudo isso custa; muito tempo, bem como cobranças de retorno de chamadas externas. Mas backups e procedimentos não testados podem ser inúteis e certamente não podem ser confiáveis.