Então, depois de muito tempo fazendo isso funcionar, descobri que havia vários problemas com minha rede. Primeiro, como @joeqwerty sugeriu que há um problema com o STP nos comutadores. Da minha pesquisa, descobri que, assim que uma porta em um switch é atualizada (como uma reinicialização da máquina), o STP é reiniciado e pode levar até 45 segundos para ser concluído. Em 45 segundos, a máquina já estará funcionando, mas terá dificuldade em obter um endereço IP do servidor DHCP e, a partir daí, apenas se transforma em erros.
A solução é habilitar o PortFast nos comutadores que definem as portas para sempre encaminhar e evita toda a fase de descoberta e designação de STP. Eu também acabei desligando o STP em cada porta em cada switch que eu sei que é uma máquina cliente ou servidor. Não tenho certeza se realmente faz alguma coisa além de ativar o PortFast, mas isso me faz sentir melhor. Certifique-se de não desabilitar o STP nas portas que se conectam a outros switches, roteadores, gateways, etc.
Outro problema também foi o Firewall do Windows. Meus GPOs desativam completamente o firewall, mas o serviço ainda está ativo. Da minha pesquisa, descobri que, quando o computador é inicializado, há um pseudo-firewall instalado, controlado pelo serviço, que bloqueia todo o tráfego até que o Windows seja completamente inicializado e o serviço seja controlado e controlado pelo Windows. Desativar o serviço melhorou ainda mais a acessibilidade de rede enquanto a máquina está inicializando.
Como medida segura, também atualizei os drivers em todas as máquinas cliente e servidor. Também atualizei o firmware da NIC em todos os servidores e switches. Por uma boa medida extra também atualizei o BIOS em todas as máquinas.
A partir de agora, tudo parece estar funcionando bem. Uma última coisa que eu estava planejando experimentar é o Jumbo Frames. Vamos ver se isso ajuda ...