Você não mencionou uma sonda. Se você olhar aqui, poderá criar um probe tcp ou http que equilibrará somente a carga quando o servidor estiver ativo e respondendo ao probe.
Eu tenho duas VMs do Windows nas quais executam dois serviços idênticos. Service1 na porta 80 e service2 na porta 8080. Essas duas VMs estão no mesmo serviço de nuvem. Configurei um balanceador de carga interno entre as VMs na porta 8080. O service1 deve consultar o service2 na porta 8080 por meio do ILB (8080) para que as solicitações sejam equilibradas entre as duas máquinas. Durante os testes, encontrei um problema, se o serviço2 na VM2 for interrompido, as solicitações provenientes da VM1 para o ILB não serão concluídas com êxito e vice-versa. Parece que as solicitações provenientes da VM1 para o ILB são desviadas para a VM2 e as solicitações da VM2 são desviadas para a VM1, como se uma solicitação estivesse sempre cruzando entre elas e nunca pousasse na própria VM que originalmente enviou a solicitação. É possível ter certeza de que as solicitações vm1 (ou vm2) estão balanceadas para ambas as máquinas ou se o serviço em service2 vm2 estiver desativado, o balanceador enviará solicitações apenas para o serviço saudável?
Você não mencionou uma sonda. Se você olhar aqui, poderá criar um probe tcp ou http que equilibrará somente a carga quando o servidor estiver ativo e respondendo ao probe.