O ELB distribui as solicitações de maneira uniforme entre as zonas de disponibilidade íntegras e, depois, de maneira uniforme entre as instâncias dessa zona. Você não pode mais configurar isso. Você deve certificar-se de não fazer algo como 3 instâncias em us-west-2a e uma em us-west-2b, já que a em 2b receberia 3x o tráfego como cada uma das instâncias 2a.
Se você quiser balanceamento de carga com base em algo como carregamento de instância, precisará criar sua própria solução no AWS com algo como HAProxy.