Para responder a minha própria pergunta… O GAL não é recomendado / suportado ("não deve", "contra-indicado" - texto fraco) com ligação de porta:
LACP support is not compatible with software iSCSI multipathing. iSCSI multipathing should not be used with normal static etherchannels or with LACP bonds.
Software iSCSI Port Binding is also contraindicated when LACP or other link aggregation is used on the ESXi host uplinks to the pSwitch
Aparentemente, o Catalyst 3850 Stackwise funciona de forma muito diferente (funciona…) do Nexus Virtual Port Channel. O tráfego nunca atravessa o canal entre comutadores sob condições normais, portanto, o iSCSI de hardware nunca obtém seus pacotes de volta das portas SAN de outros comutadores. A solução é voltar para o balanceamento baseado em ID da porta no vSwitch e desabilitar o LAG. O balanceamento de tráfego não é tão importante com 10G (o hash de IP ajudou com links 1G facilmente sobrecarregados).
Existem algumas reclamações fracas do Google que a VCP exige que o LACP funcione corretamente. Nós tivemos algumas perdas de pacotes no Switch - > A conexão do vSphere desapareceu quando desabilitamos o LAG e voltamos ao balanceamento do ID da porta. Eu estava ciente de que o vSwitch elimina o tráfego proveniente do uplink incorreto (se a VM estiver com hash no vmnic0, mas o tráfego voltar do vmnic1, ele é descartado), mas não tenho certeza se isso se aplica ao balanceamento de hash do IP. Por outro lado, a documentação afirma que apenas o IP-SRC-DST é suportado no lado do comutador. Se o VPC enviasse tráfego para o vSphere em vez da interface local do switch em vez da interface baseada em hash IP correta, ele poderia ser considerado uplink e drop "incorreto". Novamente, desabilitar o LAG funcionou bem.