A maneira normal de interagir com máquinas virtuais no ESXi é através da Área de Trabalho Remota.
Estou presumindo que a configuração tenha mais a ver com a alocação de memória suficiente para o convidado para que, quando você fizer o RDP in, você possa acessar a resolução mais alta necessária para o suporte a dois monitores.
Você viu este tópico ? Ele fala sobre o problema de reverter para um.
Além disso, parece que você precisa dizer ao seu cliente RDP para usar monitores duplos. Veja os links a seguir.
Como usar monitores duplos na sessão de área de trabalho remota no Windows 7
Aproveite o suporte a vários monitores do Windows XP Pro para Conexão de Área de Trabalho Remota
Espero que ajude. Eu não tenho o ESXi para testá-lo.